搜索
查看: 4316|: 0

文本挖掘:灵玖大数据多民族语言搜索

[复制链接]

215

主题

13

回帖

2181

积分

金牌会员

积分
2181
发表于 2016-11-22 15:33:15 | 显示全部楼层 |阅读模式
 多语言信息检索,是信息检索领域中的一个研究课题。近10几年来,由于互联网的飞速发展,这方面的研究受到了学术界的广泛重视。将这项技术应用于搜索,可以帮助我们查找到更多的有用信息,例如外语相关页面、多语言页面以等等。这些信息可以大大丰富搜索的结果,满足用户多样的需求。在跨语言信息检索的研究中,有一些研究成果已经趋于成熟,达到可以应用的状态。
  假如你搜索“甲午战争”,如果你是一个普通用户,你想知道的可能是这个事件的历史渊源和发展动态;如果你是一个文艺用户,你想知道的可能是中国愤青们的爱国言论。没问题,现有的中文搜索完全可以满足你的需求。
  但是,如果你是一个XX用户,你对中国网站的内容不满足,很想知道外国的媒体或少数民族是怎么报道的,其他民众是怎么谈论这个事件的。那么不好意思,中文搜索引擎就无能为力了。这是因为,中文搜索引擎都是中文作为基础来构建的,它往往只收录了中文数据,只考虑了中文的特性,只考虑了该中国网民的需求。但是,当我们想要做多语言搜索时,搜索就变得困难了。且不说我们没有抓取那么多外文数据。即使我们有数据了,由于不同语言之间的巨大差异,以及各个语言民族各种各样的网络习惯,我们也很难精准地搜索到相关的外文信息。也就是说,语言的不同给搜索带来了一道鸿沟。
  那么,这道鸿沟就不能跨越了么?当然不是。事实上很多年前人们就已经开始考虑这个问题了并尝试解决了。JZSearch多民族语言精准搜索引擎是灵玖软件针对少数民族语言搜索的需求而打造的一款搜索系统,它能够依据少数民族语言用户的特点,方便快捷地构建精、准、快的搜索服务。当前的搜索大部分都需要内置一部核心词库,而维语、藏语、蒙语、阿拉伯、哈萨克斯坦,韩语等多种少数民 族语言往往缺乏相关的电子资源,整理一部词典往往费时费力。JZSearch少数民族语言全文精准搜索引擎支持无词典模式,采用先进的N-Gram模型, 可以构建高速的索引与搜索。
  JZSearch少数民族语言精准搜索引擎采用了灵玖软件在自然语言理解、信息检索方面的先进技术成果,融合多年在信息发现整合方面的工作积累,弥补了当前少数民族语言搜索的空白。
  JZSearch多民族语言精准搜索引擎主要功能包括:
  1、一套系统同时支持搜索维语、藏语、蒙语、阿拉伯、哈萨克斯坦,韩语等多种少数民族语言;
  2、支持文本、数字、日期、字符串等各种数据类型,多字段的高效搜索;
  3、支持数据库,文件,网页等检索
  4、支持丰富的查询语法,支持与、或、非以及邻近运算;

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

大数据中国微信

QQ   

版权所有: Discuz! © 2001-2013 大数据.

GMT+8, 2024-11-15 01:27 , Processed in 0.056053 second(s), 25 queries .

快速回复 返回顶部 返回列表