致CSW用户:
感谢您关注 CSW分词组件。
购买联系QQ:2175252
价格:330元/套 (授权一台服务器)
关于高亮和排序的作品
作者:admin 日期:2012-05-08
分词技术源代码
作者:admin 日期:2012-05-05
- '分词技术
- dim max,keywords,r1
- r1 = Newasp.ChkQueryStr(Trim(Request("r1")))
- If strWord = "" Then
- dim obj
- Set obj = Server.CreateObject("CSW.SplitWord")
- keywords=obj.split(cstr(keyword),0,"d:\com")
- 'response.write keywords
- keywords=Rtrim(LTrim(keywords))'去掉获得的字符串最左边空格和最右边空格
- keywords=split(keywords," ")'将输入的字符串根据空格分开,获得一个数组
- 'response.write "2_"&keywords
- max=ubound(keywords)'得出这个数组的维数,即输入的关键字个数
- 'response.Write max
- if max=0 then '如果max等于0说明只输入了一个关键字,那么就不需要循环处理
- findword = "A.Title like '%" & keyword & "%'"
- else
- for i=0 to max '如果关键字很多,我们要求每一个搜索都要匹配每一个关键字,通过循环来实现
- if i=0 then '写入下面sql语句作为开头,仔细研究一下下面的代码
- if r1=1 then
- findword = findword" (A.Title like '%" & keywords(i) & "%' and "
- else
- findword = findword" (A.Title like '%" & keywords(i) & "%' or "
- end if
- else
- if i=max then '如果循环到最后一个关键字,写入下面sql语句作为结尾
- findword=findword" A.Title like '%" & keywords(i) & "%')"
- else '如果关键自己不是开头的也不是结尾的,那么循坏写入下面的sql语句
- if r1=1 then
- findword=findword" A.Title like '%" & keywords(i) & "%' and "
- else
- findword=findword" A.Title like '%" & keywords(i) & "%' or "
- end if
- end if
- end if
- next '循环结束
- end if
- end if
- '分词技术
以上代码来源于很早以前在新云cms系统下做的分词搜索。其实这段代码是可以集成到任何asp程序中的。
CSW分词组件特性
作者:admin 日期:2012-05-02
CSW分词组件公共属性及方法
作者:admin 日期:2012-05-02
| 功能及用途 | ||||
|---|---|---|---|---|
| 描述: 对给定文本序列按词组进行拆分。 | ||||
| 参数1: | InputString | string | 待拆分的原始文本序列。 | |
| 参数2: | OutputType | int | 指定输出类型 (0 标准分词输出, 1 附带词性输出, 2 附带词频输出) | |
| 参数3: | DllPath | string | 指定组件所在系统中完整路径。 | |
| 返回: | OutputString | string | 分词后的文本序列。标准输出其间使用"空格"隔开。带词性及词频输出采用"/"间隔 | |
| 描述: 查看组件相关信息 | ||||
| 参数: | 无 | string | 分词组件动态链接库文件 | |
| 返回: | AboutCSW | string | 与此组件相关信息。 | |
| 描述: 添加自定义的新词组 | ||||
| 参数1: | Word | string | 自定义的词组 | |
| 返回: | State | string | 方法执行后的状态,字符串长度等于0,则添加成功,否则为错误信息。 | |
| 备注: | 1. 如需同时添加自定义词组的词性或词频,其间须用空格间隔。如:"中文 n 62" 此处中文为自定义词组,n为词性,62为词频。 | |||
| 2. 词组最大长度10个字符;词性为英文字母,最长不超过2个英文字母;词频为整型数字,最大值不超过100。 | ||||
| 描述: 从文本文件批量添加自定义的新词组 | ||||
| 参数1: | FileName | string | 文件名称及完整路径 | |
| 返回: | State | string | 方法执行后的状态,字符串长度等于0,则添加成功,否则为错误信息。 | |
| 备注: | 1. 文件格式:每行一个词组,词组起止采用半角双引号表示,如有词性及词频,其间用空格间隔,如无可省略。例如:"中文 n 62" 此处"中文"为自定义词组,"n" 为自定义词性,"62" 为自定义词频 。 | |||
| 2. 词组最大长度10个字符;词性为英文字母,最长不超过2个英文字母;词频为整型数字,最大值不超过100。 | ||||
| 3. 导入过程中,组件将自动去除重复词组。 | ||||
| 描述: 从其它CSW词库文件格式中导入词库(不支持5.0前版本)。 | ||||
| 参数1: | FileName | string | 文件名称及完整路径 | |
| 返回: | State | string | 方法执行后的状态,字符串长度等于0,则添加成功,否则为错误信息。 | |
| 备注: | 导入过程中,组件将自动去除重复词组。 | |||
| 描述: 指定组件安装路径 | ||||
| 参数1: | DllPath | string | 组件所在系统中完整路径。 | |
| 返回: | State | string | 方法执行后的状态,字符串长度等于0,则执行成功,否则为错误信息。 | |
| 备注: | 如调用此方法指定路径,则其它方法中可不必再次指定路径。 | |||
| 描述: 产生此组件的机器码 | ||||
| 参数1: | 无 | |||
| 返回: | MachineCode | string | 组件所安装电脑的机器码. | |
| 描述: 获取组件当前版本 | ||||
| 参数1: | 无 | |||
| 返回: | VersionCSW | string | 返回此组件当前版本. | |
| 描述: 加载组件的词库. | ||||
| 参数1: | DllPath | string | 组件所在系统中完整路径。 | |
| 返回: | State | string | 方法执行后的状态,字符串长度等于0,则添加成功,否则为错误信息。 | |
| 备注: | 如调用过ComponetPath方法指定过组件路径后,则参数可略为空(零长度字符串)。 | |||
| 描述: 初始化词库 | ||||
| 参数1: | DllPath | string | 组件所在系统中完整路径。 | |
| 返回: | State | string | 方法执行后的状态,字符串长度等于0,则添加成功,否则为错误信息。 | |
| 备注: | 如调用过ComponetPath方法指定过组件路径后,则参数可略为空(零长度字符串)。 | |||
| 警告: | 如调用此方法后,则所有词组将会丢失,不可恢复,慎用。 | |||
| 描述: 更新词库. | ||||
| 参数1: | DllPath | string | 组件所在系统中完整路径。 | |
| 返回: | State | string | 方法执行后的状态,字符串长度等于0,则添加成功,否则为错误信息。 | |
| 备注: | 1. 如调用过ComponetPath方法指定过组件路径后,则参数可略为空(零长度字符串)。 | |||
| 2. 在添加新词后,须调用本方法将添加的词组写入词库。 | ||||
| 描述: 加载词库索引. | ||||
| 参数1: | DllPath | string | 组件所在系统中完整路径。 | |
| 返回: | State | string | 方法执行后的状态,字符串长度等于0,则添加成功,否则为错误信息。 | |
| 备注: | 如调用过ComponetPath方法指定过组件路径后,则参数可略为空(零长度字符串)。 | |||
| 描述: 初始化词库索引 | ||||
| 参数1: | DllPath | string | 组件所在系统中完整路径。 | |
| 返回: | State | string | 方法执行后的状态,字符串长度等于0,则添加成功,否则为错误信息。 | |
| 备注: | 如调用过ComponetPath方法指定过组件路径后,则参数可略为空(零长度字符串)。 | |||
| 警告: | 如调用此方法后,则所有索引信息将会丢失,不可恢复,慎用。 | |||
| 描述: 更新词库索引 | ||||
| 参数1: | DllPath | string | 组件所在系统中完整路径。 | |
| 返回: | State | string | 方法执行后的状态,字符串长度等于0,则添加成功,否则为错误信息。 | |
| 备注: | 1. 如调用过ComponetPath方法指定过组件路径后,则参数可略为空(零长度字符串)。 | |||
| 2. 在添加新词后,须调用本方法更新词库索引。 | ||||
CSW分词组件能干什么
作者:admin 日期:2012-04-27
让您网站内的搜索引擎变成多关键字模糊搜索模式。我们知道传统搜索都是单关键字搜索的。
例如:
您的网站中有一篇文章叫做 csw分词组件
而用户必须输入如: "csw” "csw分词组件" "分词组件" 等按照先后顺序的关键字才可以找到
但如果安装了csw分词组件,我们可以输入"csw组件" 来找到这篇文章
原理就是因为普通搜索模式下,用户输入"csw组件"关键字,系统认为这是一个关键字并在数据库中查找符合"csw组件"的文章
但是发现"csw组件"和文章"csw分词组件"无法匹配,所以无法找到。
而安装了csw分词组件后,系统是把用户输入的"csw组件"自动拆分为"csw"和"组件"两个关键字,并在数据库中查找符合csw关键字并符合组件关键字的文章。这样 就可以找到了。
csw分词搜索介绍
作者:admin 日期:2012-04-27
|
简介: CSW中文分词组件,是一套基于标准C++开发的,可自动将一段文本按常规汉语词组进行拆分,并以指定方式进行分隔的DLL组件。本组件采用完全自主开发的高效的分词引擎及拆分算法,具有准确、高速、资源占用率小等特点。为了满足客户对文本语义进行研究分析的需要,本组件同时提供词性及词频标注功能,可根据用户要求,对其拆分后的词组进行词性标注或词频标注。其广范应用于互联网信息检索、数据库信息查询、智能聊天机器人、文本校对、自动翻译、 自动摘要、自动分类及信息加工处理等各个领域。 软件介绍: |
| 应用平台 | 封装方式 | 支持语言 |
| MS Windows 2000/XP/2003或更高 |
COM接口 | ASP、ASP.Net、C#、VB.Net、VB6.0、Delphi、VC等 |
| MS Windows 2000/XP/2003或更高 |
C接口 | C、C++、VC6、VC.NET、BC、PHP 等 |
| MS Windows 2000/XP/2003或更高 |
Java调用接口 | Java、JSP |
| Unix/Linux | so | [ 暂未推出 ] |
| >> 在线演示 [北京网通] |
