人工智能将开启文献搜索新时代,代替传统搜索方式?

人工智能(Artificial Intelligence – 简称AI)作为21世纪关注度最高的词汇之一,形容计算机学中机器能够模仿人类的认知模式,感知周围环境,像人类一样进行“思考、解决问题”,从而进行反应找出达到目标的最快最佳方案。21世纪以来随着大数据和机器快速发展,Al被广泛运用,从航空、医疗到算法交易,现在AI会不会又为科研开启一个全新的学术检索时代呢?

传统的搜索引擎例如谷歌是在“网上爬行”(web crawling)这种数据采集方式的基础上运用一些算法来提供实时的信息搜索结果。“爬行”就像在蜘蛛网上爬一样,通过一个链接找到下一个链接,理论上来说可以搜索到全网信息,在此期间运用一些“爬行”规则(crawling policy)来过滤掉可能是垃圾的内容。接下来编入索引(indexing)可以把词与爬行到的域名联系在一起,起到存储作用,存入公共数据库。然后通过用户输入的关键词在检索中找到对应的信息。基于这样的技术,Google Scholar则是特别为学术检索而推出的网络应用,特点为能检索阅读的学术资料极其丰富,提供引用信息,便于用户组合选择的结果排列方式等。

而以AI为基础的新型知识搜索方式正逐渐被开发,比如Yewno,模仿人类大脑的运作方式,相较于使用关键字搜索的谷歌这类传统引擎,它能够通过全文分析、计算机语义分析和机器学习等方法来提炼文献的含义,从而图文并用给使用者提供相关材料。这个系列产品中Yewno for Education已经于去年7月上线,除了教育,公司还开发了其它三个领域:出版行业、金融和生物医学。

另一同样基于AI而设计更为个性化的是由一位剑桥大学博士生创立的Sparrho,其特点在于通过分析理解用户需求,每小时可以将45000份文献分类,选择推送最相关的领域动向给用户,Sparrho在传统的搜索功能上加入了保存分享的功能,同一个科研团体可以利用这个平台同步知识阅读。

类似的还有UNSILO,这个应用也强调对自然语言与意义的处理分析,所以在没有事先设好分类法(taxonomy)的基础下也可以准确提炼文献中的概念。为达到不同行业的搜索需求,UNSILO在与不同信息源(例如学术出版方)合作时也有不同的方案。

除此之外,非盈利组织AI2(Allen Institute of Artificial Intelligence)开发的Semantic Scholar也备受关注。它运用了AI的设计,可以在搜索信息的基础上判断文献的价值,提炼其中数据,它提出使用深度学习模型的方式来根根据论文题目和摘要来为文献综述预测最有价值的引用材料。但2015年上线之初,Semantic Scholar在学科涵盖度和文献数量上远不及谷歌等传统搜索平台。这里值得一提的是Microsoft Academic,它是原有的Microsoft Research与AI2等合作的成果,有些学者对Microsoft这一努力十分看好,认为这集合了AI2深度语言处理的能力与Microsoft极大的数据来源两种优点。

不难看出这些以AI为基础的搜索引擎正走向越来越个人化的设计方向,大多数学者也认为运用这些搜索平台、通过对自然语言的处理会提高精确度、效率,但有人表示应该短时内并无法用它们代替谷歌这一类搜索引擎,因为现有的AI搜索平台中的文献数量与科目范围都不及谷歌。AI2的CEO - Oren Etzioni也说并没有想要和传统搜索引擎激烈竞争,如不少学者所说,不远的将来,他们将取其优点,两者搭配使用。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,128评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,316评论 3 388
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,737评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,283评论 1 287
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,384评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,458评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,467评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,251评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,688评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,980评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,155评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,818评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,492评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,142评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,382评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,020评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,044评论 2 352

推荐阅读更多精彩内容