内容重点: 因为偶尔自学 python,看的东西杂又不精,偶尔翻到 nlp 相关的内容,发现如下内容:PyCon China2019 中藤井美娜,里面提到过用 python,结巴分词,word2vec 之类处理,用大量的合同进行训练,然后折腾出模型,对一个新的合同内容进行风险预测 地址是 https://www.bilibili.com/video/av75148536?p=10 但是内容中没有具体代码,所以请问有谁有实战教程么?
1
TimePPT 2020-05-09 17:50:00 +08:00 via Android 1
视频没看。不过法务相关的 NLP 能力一直是业界比较热的,因为大多是比较书面或者格式化的文字,处理起来会规整很多。
既然是风险预测,首先是要定义风险都来自哪些。然后去看合同条款的语义中是否有风险信息。 实现教程要么看 paper 要么自己理解了去分解成典型 NLP 任务自己怼 |
2
justicelaw 2020-05-12 16:27:18 +08:00
从法律从业者的角度提个问题:拿来训练的合同是怎么确定是否合法的?(因为不同的法院对同一份合同是否合法都可能存在不同意见)
|
3
xingshu1990 OP @justicelaw 对于有争议的地方、或者文字内容术语高危内容的,优先展示出来。
本身考虑的是用 python 检测出 对本公司不利的合同条款,进行程序化筛选。 |