《经济学人》曾发文称“世界上最有价值的资源不再是石油,而是数据”(The world's most valuable resource is no longer oil, but data.)。
得益于互联网与大数据技术的迅猛发展,数据正以前所未有的速度巨量生成,海量的数据资源由此产生。如何运用数据挖掘技术对这些大数据加以挖掘和分析,即提取(或 "挖掘")有用的情报,预测趋势,减轻风险,从而解决问题并做出正确的决策,则成为了大数据时代下的全新选题。
数据挖掘(Data Mining,DM)又称数据库中的知识发现(Knowledge Discover in Database,KDD),是目前人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。
数据是反映事物发展的直接表现,而数据挖掘则是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策。目前数据挖掘技术的价值已在金融 、医疗、保险及零售业等行业广泛运用并得到了验证。如果对法律行业的大数据进行挖掘,则可大幅提升法律从业者的工作质量和效率,甚至于颠覆传统法律行业的工作模式,这种天然的数据价值与数据挖掘技术十分契合,使其成为数据挖掘应用的最佳垂直领域。将数据挖掘技术运用于法律行业,势必会给法律行业带来前所未有的机遇与挑战。
01
律师法律服务效能得以提高
中国裁判文书网,自2013年上线,截至2022年2月23日,中国裁判文书网文书总量超过1.2亿篇,访问总量超过811亿次,是我国最大的法律文书数据库。
裁判文书是承载全部审判活动、体现审判结果的“司法产品”。单份裁判文书就蕴含着丰富的信息,包括当事人的诉求信息、犯罪行为信息、行政执法信息、司法裁判行为和过程信息、法律的适用信息等,而这些恰恰是集聚法院“大数据”的核心要素信息。
当大量的裁判文书集中后,通过深度挖掘其所承载的信息,既可用于分析社会矛盾、治安形势的发展状况和依法行政的水平,也可用于分析审判态势运行情况和总结审判规律、研判预测审判形势,还可用于分析司法的公信力和权威性状况,具有明显的价值多元性。
对于诉讼类律师法律服务来说,数据挖掘技术能够帮助他们更高效地厘清案情事实,形成案件涉及的人、事、物等多方面记录的全景式分析;能够提供多样化的证据材料,准确 对案件性质以及法律适用作出判断;能够全面精准进行案件相关信息整合与分析,更有针对性地进行案件诉讼方案设计。
对于非诉讼类律师法律服务来说,能够提高法律咨询效率、文书服务水平,有效监督非诉讼法律行为代理、协助以及合同等履行情况,保证计划拟定和谈判方案合理性,促进服务对象内部规章制度的制定。
02
律师法律服务范围得以拓展
一方面大量的律师接不到案子,长久以来,律师业务来源主要依靠口口相传的口碑模式,律师群体被赋予了一种精英、高端的形象,这样的形象也使得他们很难像其他行业那样进行营销活动;同时这一行业的营销也受制于主管部门的约束和规定。
另一方面又有大量的客户没有合适的路径找到合适的律师,通过对超过1亿份裁判文书进行分析,发现有超过6700万份案件的当事人没有获得律师的帮助。而部分当事人即使得到律师的帮助,也会因为信息不对称,无法根据现实需要找到最合适自己的律师。
如果运用数据挖掘技术,对法律大数据加以利用,将客户的需求、律师的执业信息等数据进行归纳整合,并对他们进行数字画像,形成一个专业的法律服务平台。用户通过平台可以筛选出合适的律师,并直接进行咨询;而律师也可以更加充分地了解客户需求,为客户提供更加专业性、有针对性的法律服务。从而打破过去受限于时空的服务范围,动态调节律师与客户间的供需平衡。
例如某一律师的执业年限、办案经历、擅长领域甚至是胜诉率等信息,都会进行挖掘和展示;律师也可以根据自身擅长和关注的领域挖掘潜在客户、获取商机,并对客户的需求在数据库进行类案比对,了解案件的法律依据、证据材料等信息。
03
律师法律服务环境得以改善
在以往,大量的数据分散在各个角落,律师在办案时往往要往返于各个平台,花费大量的时间才能获取到需要的信息,极其容易造成信息的遗漏或错误。
而现在,借助已经渐渐成体系的权威数据平台,不仅能更为高效地检索到所需要的资料和信息,凭借强大的数据挖掘技术,还能将大量数据进行聚合与分析,从而进一步节省律师在立案、开庭等环节的时间,基于大数据可以获得法律服务相关信息,有利于进行信息的社会反馈,也在很大程度上改善了法律服务环境。
前文中提到数据挖掘具有规划未来的作用,而这对于律师业务的开展而言是不可或缺的资源,试想一下:当律师接受案件委托或准备提供法律服务时,就已经通过数据挖掘,获得几方当事人的信息及主审法官以往的类似裁判案例,结合这些信息来为我们之后开展的诉讼和非诉业务进行合理的分析预测,根据分析预测结果来制定和调整诉讼策略及服务方案。
通过数据挖掘总结出来的模型和规律,以往是在开庭之后或提供法律服务之后我们才会知晓的事情,现在便可提前预测到,这将极大的提升律师法律服务的高效性和准确性。
在未来,法律和法律行业或许不再只依靠辩论的力量,而是通过利用先进的技术,便可以预测诉讼结果,甚至可以在提起诉讼通知后立即赢得诉讼。但目前,数据挖掘仍然是法律领域的一种新实践,还有着极其漫长的路要走。
01
数据失真和不全面
数据挖掘是基于大数据的前提下,前文中提到目前中国裁判文书网已公开1.2份裁判文书,这一数据乍一看确实庞大,但当这1.2亿份裁判文书平均到每个案由、每个罪名上,数据看上去就没有那么大了,如果再进一步细分到数以千计的法院、法官上,那么这个数字就更少了。
同时有一项研究显示,在河南省184个法院2014年上网公开的案件只占全部案件的41%,占比不足一半,而全国各地不同法院在公开程度上亦同样存在较大的差异(从15%到83%)。当数据不全面或失真时,对数据样本进行挖掘分析便会有失偏颇,无法形成对律师的案情指导。
02
对律师的专业度要求更高
凭借着数据挖掘技术,律师能够对委托人的案件进行一个前期预判,但同样的当事双方也可以利用这一技术进行准备,为此律师反而必须更加专业和谨慎地对待案件,否则一旦因个人过失造成败诉,便会在平台留下执业记录,从而影响到自己在未来的职业发展。
随着数据挖掘技术不断融入法律行业后,过去信息不对称的局面将被逐渐打破,律师的执业信息将会被完全公开,客户可以通过这些信息对律师进行筛选,形成更加激烈的竞争局面,倘若律师的法律服务不被认可和信任,将会损失大量的潜在客户。
身处大数据时代,我们正无时不刻不受到大数据广泛而深刻的影响。这不仅为数据挖掘在法律服务行业的发展提供了空前机遇,也是传统法律服务向数字化法律服务转型的一个重要契机。
而当下,更为要紧的工作可能是正视并努力突破数据挖掘所面临的困境与羁绊。要正确理解法律大数据并加以利用,科学、有效地开展数据分析研究,帮助律师更好地获取商机,使我们的法律服务行业借助数据的力量实现质的蜕变。