上一节最后讲到了建立一个extractor的方法,手工建立和机器学习等,这一节详细阐述手工建立pattern的方法。引用Jurafsky教授常说的话:
let‘s look at the intuition.
Jurafsky教授讲话总是微皱着眉头,感觉很较真的样子,十分可爱。
人工模式的概念很简单,譬如这样一句话:和毓婷一样,新斯诺滴丸是一种避孕药。
假如你年纪还小不知道什么是新斯诺滴丸,那你看到“XXX是一种XXX”这样一个模式以后,你也会知道新斯诺滴丸就是一种避孕药。“和XXX一样也是一种模式”,譬如你就知道了新斯诺滴丸和毓婷属于同一种东西。
手工模式的优缺点(Plus and Minus)
优点:
准确率高、能够定制某些特点的行业
缺点:
召回率低、麻烦、想这些模式要想破脑袋
以前做车牌识别最后匹配字模的时候就用到了手工模式,精准是精准,确实很麻烦,而且不具通用性。
斯坦福NLP笔记48 —— Using Patterns to Extract Relations,布布扣,bubuko.com
斯坦福NLP笔记48 —— Using Patterns to Extract Relations
原文:http://my.oschina.net/silverhammer/blog/293094