金软Html文本抽出是由北京信久通科技有限公司独立开发的一款专门从Html文件批量抽出文本的工具。使用灵活,操作简单,并充分吸收了一些大型文本筛选工具的运行理念,能够独立完成html文本抽取开展的各种活动安排,高效、实用!
金软Html文本抽出主要支持17种常见可转换字符集,能在输出文件名末尾加文件生成日期后缀。可以实现对html文件批量抽取文本完善的流程控制,节省时间和精力,提高用户满意度,有需求的朋友请下载体验。
功能特色
1、支持17种常见可转换字符集。
2、支持5中常见Html文件的语言。
3、支持在输出文件名末尾加文件生成日期后缀。
4、支持批量处理,操作简便,节省时间。
支持Html版本
Html Ver.4
Html Ver. 5/7(95)
Html 98
Html 97/2000/XP
Mac-Html 2001
可以从上述文件的各种编码字符集数据中抽取文本。
支持的可转换字符集
EUC-JP
EUC-JP-FIX
ISO-10646-UCS-2
ISO-10646-UCS-4
ISO-2022-JP
ISO-8859-1
Shift_JIS
UTF-16
UTF-8、WINDOWS31J
ChineseGBK
ChineseBIG5
GB18030
KoreanKSC
Shift_JIS-2004
ISO-2022-JP-2004
EUC-JIS-2004
支持的可抽出字符串
Unicode字符集
日语
英语(只限于拉丁字母字符集ISO_8859-1)
汉语(简体字 GB18030、GBK、繁体字Big5)
韩语(KS_C_5601_1987)的字符串
使用上述语言外的字体时,无法保证抽出结果的正确性。
|