NLP技术如何引爆法律行业数据能量?

自然语言处理(简称NLP)被誉为“人工智能皇冠上的明珠”、“实现通用人工智能(AGI)的钥匙”。近年来,随着技术的进步,NLP技术越来越多地被应用到了法律领域,为法律科技行业带来了新的发展契机,引爆了法律行业内含的强大数据能量。

01 法律服务领域存在的几个主要问题

1.资源匮乏

虽然数据显示中国律师数量在过去10年间已经从23万增加到了60万,但在国内庞大的人口基数面前,这些律师远不能满足普通民众对于法律服务的需求。总体上来说法律服务资源属于稀缺品。

为了满足这一部分需求,借助互联网技术的发展,“互联网+法律”的可能性被不断延展出来,其中很重要也很典型的做法就是:通过搭建互联网平台为律师和客户提供一个在线沟通的渠道,即律师库+在线咨询的模式。这种模式让律师群体更多更广地触达了用户,在一定程度上满足了普通民众对于法律服务的需求,但远远不够。

2.信息不对称

信息不对称具体体现在两个方面:一是法律对大众来说“遥不可及”,法律普及率不高、大众法律意识不强,也就造成了法律的“低频”属性;二是信息不透明,用户对律师的特点、水平无从了解,再加上大众对律师的固有印象又是收费贵、价格不透明,也就导致了用户对律师缺乏信任度,让大众谈到“请律师”都望而却步。

律师的水平信息不对称,普通大众不懂法律,寻找合适的律师成本高。互联网法律平台已经在解决律师水平信息不对称方面做出了很多的努力,AI技术的进步,或许能够让智能匹配更加准确。

3.服务成本高

非诉法律服务中普通交易的咨询、谈判,以及文件拟定和修改工作,往往采用小时计费。诉讼案件除了律师费,还要付出收集证据、出庭等大量的时间成本,律师整理案卷、核对合同、核查资料等工作,重复性高,费时费力,最后都转化成当事人承担的成本,费用高昂。

但对于普通民众而言,并非所有的法律问题都会直接上升到诉讼层面,更多的需求场景发生在前期的法律咨询期间。他们更多的是想了解“我可以通过什么样的法律途径去解决问题”、“我需要做哪些准备工作”等问题。然而现实中,一小时动辄上千元的法律咨询费属实难以承担。


02 AI领域中的自然语言处理技术(NLP)成为科技驱动法律的主要趋势

英国著名法学学者Susskind在其著作《明天的律师:预见你的未来》(Tomorrow’s Lawyer: an Introduction to Your Future)中提到:在法律行业,200年之内对其改变最大的就是人工智能。在人工智能出现之前,机器只能处理结构化的数据(例如:Excel 里的数据),但是网络中大部分的数据都是非结构化的,例如:文章、图片、音频、视频…在非结构数据中,文本的数量是最多的,虽然没有图片和视频占用的空间大,但是文本的信息量是最大的。为了能够分析和利用这些文本信息,我们就需要利用 NLP 技术,让机器理解这些文本信息,并加以利用。

什么是NLP技术?

NLP是Natural Language Processing缩写,中文翻译过来就是自然语言处理。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。自然语言处理技术是通过建立形式化的计算模型处理人类发展演变而来的语言(自然语言:汉语、英语及法语等)。即模仿人类书写和阅读文章的能力,使机器获得识别、分析、理解及生成文章的能力,实现人机间的信息交流。基于人工神经网络的深度学习理论将人工智能带入一个新时代:认知计算。认知计算的目标不再是寻求现实中的最优解或在给定数据结构上进一步提升搜索性能,而是让计算机系统能够像人类的大脑一样学习、思考,并做出正确的决策。

NLP如何助力法律检索?

检索系统主要采用的是NLP文本挖掘技术,是从文本中获取高质量信息的过程,同时是机器学习下一种无监督式自主学习方式,其目的是对原始资料进行分类,把相似的东西聚集在一起,以便了解资料内部结构(监督式学习可以在训练资料中学习或建立一个模式,并依此模式推测新的实例)。文本挖掘的一般流程为:1.文本数据源获取;2.数据预处理;3.数据挖掘和可视化;4.搭建模型;5.模型评估。既可简单对文档中的词汇,赋之以不同的权重来建立索引,也可建立更加深层的索引。在查询的时候,对输入的查询表达式比如一个检索词或者一个句子进行分析,然后在索引里面查找匹配的候选文档,再根据一个排序机制把候选文档排序,最后输出排序得分最高的文档。

得理法搜就是一款拥有国际领先的NLP技术的搜索引擎,能检索信息以及自动生成检索报告和要素提取,节省时间,提升效率,为各领域法律人提供更好的法律信息服务,极大提高律师办案效率。除此之外,法搜还能挖掘大量数据中的关键点或者看起来不相关,但经过规模化分析后有价值的关键点,以及发现战略增长和经常性的案件变化的趋势,从而帮助用户在更短的时间内做出更明智的决策。

NLP如何理解法律问题?——法律规则分析推理

法律是一个重文本的专业领域,无论是合同、诉讼或是法律法规,其中都涉及了海量的自然语言。NLP技术就是通过分析法律文本中不同语句的前后逻辑对应关系,为计算机建立相对科学的模型,使得计算机在经过机器学习后能够判断文本的内容、类型和状态,从而实现自动识别有效语句所处的段落并根据已有信息对正在生成的文本进行判断。

得理产品中的法问就是基于NLP、语音交互及知识图谱等技术打造的一款为用户提供法律问题咨询的工具,它能对用户用自然语言表达的问题,给出一个精准的答案。简单来说就是从用户给定文本中抽取重要的信息,比如时间、地点、人物、事件、原因、结果、数字、日期、货币、专有名词等等来了解谁在什么时候、什么原因、对谁、做了什么事、有什么结果。法问系统对自然语言查询语句进行语义分析,包括实体链接关系识别,形成逻辑表达式,然后到知识库中查找可能的候选答案,再通过一个排序机制找出最佳的答案提供给用户。

这样一来,法问便既能帮助企业与个人解答基础性法律问题,又促使法律服务提供者从低附加值的工作中脱离,提升服务品质和价值。

NLP如何助力合同智能生成、审查、修改?

律师是如何审核一份合同的?按照计算机的思维将律师审查的步骤进行拆解,在此基础上逐步丰富合同种类和合同内容,就能够保证计算机不断学习沉淀持续进化,最终达到智能审核的目标。实现合同智能审查的效果,我们需要提前做两项关键的工作:“规则”+“数据”。

梳理不同合同类型的审核规则,输入大量的合同文本数据,然后由计算机基于前面输入的审核规则进行训练,由此可对文档关键内容进行结构化提取,如主题信息抽取、合同违约金额提取、地址提取等来进行形式审查,可广泛适用于多个场景。

在实质审查方面如合同要素提取、审核清单、缺失条款和风险提示、文字纠错、版本对比等,通过识别Word、PDF、扫描件等纸质版、线上电子版修改比对,快速实现修改部分和本体定位,准确找出修改区域来对合同进行智能比对,提高审核人员效率。并且能有效识别文书存在纰漏并给出纠错建议和提示,如错别字、敏感信息、风险点等,提高文书表达准确度、保障审核效率和文书质量。依据规则和要求,自动对企业内部文书、合同进行合规性审查,可提示更正内容和相关法条推荐,有效辅助工作人员提升合规性效率


03 NLP助力律师迎接数智化时代挑战

数智化时代的一个关键特征是“引爆既存数据能量”,大部分律所在信息化时代和数字化时代就已经积累了许多数据和信息,但由于缺少将存在于人脑及电脑中的知识进行解封进而实现复用的能力,导致既存的数据价值未被完全开发甚至变成一种负担。数智化时代,通过基于知识的数智系统,在已有基础数据上进行整合、转换、清洗、结构化处理后转换成有关联、可视化、能被洞察的信息后进行深度学习从而挖掘出可执行的决策。将更好地发挥既存数据的价值,释放数智潜力,进而赋能律所或律师个人敏捷决策、智能升级。

数智化时代法律市场外部环境挑战:

1.黑天鹅事件导致不确定性增加

全球范围内,原油、新冠疫情、俄乌战争等黑天鹅事件让律师就业发展外部环境的不确定性因素增加,很多之前积累的经验失效。

2.竞争加剧,新势力冲击行业格局

数智化浪潮下,创新势力云原生或数字原生代企业以及积极拥抱新技术的企业将不断注击行业竞争格局,不仅为传统律师服务、工作模式带来巨大的转型压力,泛法律服务行业也可能有更多竞争者进入。一方面、AI技术会代替部分标准化、简单知识服务的法律业务;另一方面对律师的专业服务成本控制会越来越严,对律师专业化程度的要求也会越来越高,律师行业的竞争格局会发生根本性的改变。

3.需求变革,个性化或定制化成主流

用户或客户的需求趋势已呈现出个性化、多元化、定制化等特点,在进一步激化市场竞争的同时,将对法律科技企业能力提出新需求、新挑战。

目前,律所形式存在两个趋势:精品化律所或团队组织化、规模化、平台化。长期以来,这两种模式会并存,前者是紧密协同性、塑造精干的团队品牌性;后者则追求符合规模化、网络化的效应。如果平台品牌能够给律师带来附加值,在成本、信息化方面提供便利,彼此信任、分享,形成良好内部交易系统,则平台化律所在成本上占优势。对每一个法律人来讲,工作时间极为宝贵。如果有律师可以优先使用足够多的技术提高工作效率节省更多的时间,做更多更有价值的事情,那么他就有更多的机会在法律服务市场中占据更大的价格优势,抢占先机。

在这样的背景下,律所需要做到的是,选用更省时省力的科技工具去完成知识分享、在线协同等流程性工作,让律师的精力更多集中于去用法律专业知识去为客户服务。这无疑对法律科技产品提出了更高的要求。

如何应对

前文对行业痛点、NLP技术以及大环境下的新挑战进行了认识与分析,可以预见的是,法律服务正在朝着管理更加精细化、技术更加现代化的方向发展。专业精细化和服务科技化是未来法律服务的核心,而传统的律所运营模式则可能迎来较大的改革和冲击。律师和其他法律服务工作者应该敏锐地洞察变化,拥抱创新,在行业革新的潮流中积极地迎接改变。

由点至面来实施应对策略,可从三个层面上来实践:

首先是作为法律人的个体复合型能力实践。对于想追寻新机遇的年轻人,未来的法律服务会越来越多借助其他领域,跨专业人才将会涌现更多的需求。新时代的法律人应当学习了解例如管理、计算机、系统分析等其他学科,既精通法律规则又熟悉信息技术的法律人才,在职场上会越来越抢手,可选择的机会也会更多样化。

其次是律所作为平台应当积极布局数智化转型。人工智能的深度化应用,需要参与办案各环节的信息化系统的打通与数据的统一。但要进行系统对接,不仅需要强有力的统筹协调,而且成本也较高。裁判文书网已公开的数据不包含全部案件信息,也缺乏结构化标签,全面收集分散在各个律所、法院的案件信息难度非常大。目前市场已有的人工智能、大数据相关法律服务系统,其底层基本上都是统一的数据集和技术内核,然后封装成统一的内核平台,在内核平台之上挖掘数据价值,进而演化成面向不同主体的法律服务平台,既服务于当事人纠纷解决的全环节,又有助于在法律数据层面上打破数据孤岛。

第三,真正的数智化组织需要基于现有的数字化工具,构建新的包含管理机制、人员能力、律所文化、技术支撑的整合、全面的组织体系,以有效支撑律所实施数智化转型战略。组织、文化、人才机制,这些看不见摸得着的软性竞争力,往往是律所数智化转型过程中脱胎换骨的关键。提高数字化工具的利用率,让简单纠纷低成本解决,法律服务门槛更低、更公平,能够惠及更多的人。通过人工智能技术同案参考实现同案同判,进行证据完整验校,降低冤假错案的出现率,法律服务更加公正。数智化把这些环节变成数字,变成公式,从不确定中找出确定性,找到了数字模型,从经验变成逻辑性。

04 结语

数据的累积,是一个能量不断增长,能量不断变化的一个过程。海量的数据,需要转变为海量的数据资产。在被存储成本压垮之前,我们需要有基础设施,来对数据进行规模化的清洗、加工和应用,真正从“原油”中炼出价值。数据资产化、流程合理化、减轻对人的需求,形成一套可复制、可推广、可赋能的数智化管理模式。数据连接一切,数据驱动一切、数据重塑一切。未来,唯有数据只增不减,而数据智能恰恰建立在全局数据基础之上,成为人类应对不确定性的底气。

NLP技术作为传统法律行业向数智化转型的撬动点,让我们能够迈向数据智能,用数据激活连接,用算法代替经验公式,用数据智能总结过去、反映当下、预测未来。

同时,推进”数实融合”,利用知识释放数据红利,最终建立在连接,是律师群体迈向数智化、成长为未来精英的必由之路,也是攻坚所在。相信在未来,随着NLP技术的不断发展和深入应用,法律行业具备的数据能量能更多被引爆出来,法律数智化未来可期。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,377评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,390评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,967评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,344评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,441评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,492评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,497评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,274评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,732评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,008评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,184评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,837评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,520评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,156评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,407评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,056评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,074评论 2 352

推荐阅读更多精彩内容