|
|
 |
| 简介: CSW中文分词组件,是一套基于标准C++开发的,可自动将一段文本按常规汉语词组进行拆分,并以指定方式进行分隔的DLL组件。本组件采用完全自主开发的高效的分词引擎及拆分算法,具有准确、高速、资源占用率小等特点。为了满足客户对文本语义进行研究分析的需要,本组件同时提供词性及词频标注功能,可根据用户要求,对其拆分后的词组进行词性标注或词频标注。其广范应用于互联网信息检索、数据库信息查询、智能聊天机器人、文本校对、自动翻译、 自动摘要、自动分类及信息加工处理等各个领域。 |
| 应用平台 |
封装方式 |
支持语言 |
MS Windows
2000/XP/2003或更高 |
COM接口 |
ASP、ASP.Net、C#、VB.Net、VB6.0、Delphi、VC等 |
MS Windows
2000/XP/2003或更高 |
C接口 |
C、C++、VC6、VC.NET、BC、PHP 等 |
MS Windows
2000/XP/2003或更高 |
Java调用接口 |
Java、JSP |
| Unix/Linux |
so |
[ 暂未推出 ] |
|
|
|
| |
支持Java语言调用的CSW中文分词组件现已开发完成,并附示例代码
基于C接口的CSW中文分词组件现已开发完成,并附示例代码
基于Windows平台的CSW中文分词组件5.0版现已开发完成,并正式发行。
5.0版完全采用标准C++全面改写,较前版本的分词组件,速度上有数十倍的提高,充分满足大量文本拆分的需要。
重新改进的拆分算法可更加有效的识别歧义词组,准确性有质的提高。
应用户需求,CSW5.0分词组件晚些时候将会推出Linux平台下版本,敬请留意。
[ 上海电信 ] :在线分词演示
[ 北京网通 ] :在线分词演示 |
|