[检索/软件] 我看欧专局的专利数据库

2010-4-4 04:18
672219
deltajs  注册会员 | 2010-5-13 05:37:41

Re:我看欧专局的专利数据库

Re:我看欧专局的专利数据库
广告位说明
deltajs  注册会员 | 2010-5-13 05:38:47

Re:我看欧专局的专利数据库

Re:我看欧专局的专利数据库
广告位说明
dzx111  高级会员 | 2010-5-13 17:20:25

Re:我看欧专局的专利数据库

对于这种笔误,翻译错误比比皆是,很多中国的人名、公司名在欧专局收录的时候,叫zhang xiaoming   还是xiaoming zhang  又或者因为空格缩写等等各种情况,很容易出现漏检误检(再比如清华大学的各种英文翻译方法)。而目前公开的数据库中,通常是按照关键词检索,如果用模糊检索的话,可能会避免漏检,但误检的情况会更严重。

还是从检索本身的目的出发,如果检索目的是为了查出来即可,那么重点解决的是漏检。
如果检索目的是为了建库做分析,那即要避免漏检,还要避免误检。
dzx111  高级会员 | 2010-5-13 17:41:02

Re:我看欧专局的专利数据库

解决漏检的办法,一是通过穷举,把各种错误情况和不同翻译方法收集全,再去检,这只是一个笨办法,工作量可想而知

另一种建议就是利用同族,比如上面deltajs 说的美国专利US7309922B2,即使一篇出错,其他同族不见得发生同样的错误。

第三种,换不同的检索条件,第1次用关键词查,第2次用公司查,等等

如果建库,肯定是一个库对应多个检索式才可以。

PS:PDF原文如果出错,在检索时也是不能实现PDF的全文检索的。
deltajs  注册会员 | 2010-5-14 05:26:48

Re:我看欧专局的专利数据库

从理论上而言,利用同族专利的话,可以部分解决。但是会有两个问题。
第一,对于一些较大的公司,其在全球有上万个专利,数据量一大,就无法处理了。
第二,对于比较新的专利而言没有办法。

这句话看不明白。
PS:PDF原文如果出错,在检索时也是不能实现PDF的全文检索的。
dzx111 wrote:
解决漏检的办法,一是通过穷举,把各种错误情况和不同翻译方法收集全,再去检,这只是一个笨办法,工作量可想而知

另一种建议就是利用同族,比如上面deltajs 说的美国专利US7309922B2,即使一篇出错,其他同族不见得发生同样的错误。

第三种,换不同的检索条件,第1次用关键词查,第2次用公司查,等等

如果建库,肯定是一个库对应多个检索式才可以。

PS:PDF原文如果出错,在检索时也是不能实现PDF的全文检索的。
dzx111  高级会员 | 2010-5-14 18:30:34

Re:我看欧专局的专利数据库

deltajs wrote:
从理论上而言,利用同族专利的话,可以部分解决。但是会有两个问题。
第一,对于一些较大的公司,其在全球有上万个专利,数据量一大,就无法处理了。
第二,对于比较新的专利而言没有办法。

这句话看不明白。
PS:PDF原文如果出错,在检索时也是不能实现PDF的全文检索的。

1 利用同族数量多,就只能用软件工具。
2 没错,簇新簇新的专利刚刚申请公开,还没同族哪。

PDF原文,就是你贴的那个
这个笔误是出现在原文PDF里,PDF都是编辑过的文件,里面可能都合成成图了,不能用来检索。所以真正检索的是电子格式的著录项。(欧专局是网页格式的,能用鼠标选取复制的)

很多人问能不能实现全文检索,其实没有把全文电子化的话,只是PDF或者像国知局的图片Tiff格式,是不能用来检索的。

所以检索窗口里没有权利要求、说明书、全文查询的条栏。
deltajs  注册会员 | 2010-5-14 21:22:50

Re:我看欧专局的专利数据库

关于PDF原文的问题,其实US, EP, PCT,DE等国家是有代码化全文的,只是在EPO网站上没有而已。对于权利要求的检索,如果是美国专利,可以直接在USPTO或是GOOGLE解决,但是对于EP, PCT, DE等国家,利用EPO就不行了。因为这些代码化全文是要另外买的,必须通过商业数据库才行。而仅仅利用ti+ab去检索,检索的准确度就很难保证了,我遇到的经常做专利检索的人,都有这感觉。

如果哪个技术报告说是用EPO网站数据做的,个人觉得这个报告不具备可靠性。
dzx111 wrote:

PDF原文,就是你贴的那个
这个笔误是出现在原文PDF里,PDF都是编辑过的文件,里面可能都合成成图了,不能用来检索。所以真正检索的是电子格式的著录项。(欧专局是网页格式的,能用鼠标选取复制的)

很多人问能不能实现全文检索,其实没有把全文电子化的话,只是PDF或者像国知局的图片Tiff格式,是不能用来检索的。

所以检索窗口里没有权利要求、说明书、全文查询的条栏。
dzx111  高级会员 | 2010-5-15 00:03:53

Re:我看欧专局的专利数据库

deltajs wrote:
关于PDF原文的问题,其实US, EP, PCT,DE等国家是有代码化全文的,只是在EPO网站上没有而已。对于权利要求的检索,如果是美国专利,可以直接在USPTO或是GOOGLE解决,但是对于EP, PCT, DE等国家,利用EPO就不行了。因为这些代码化全文是要另外买的,必须通过商业数据库才行。而仅仅利用ti+ab去检索,检索的准确度就很难保证了,我遇到的经常做专利检索的人,都有这感觉。

如果哪个技术报告说是用EPO网站数据做的,个人觉得这个报告不具备可靠性。

权利要求的检索有的数据库有,有的数据库没有,比方说国家知识产权局的,CNIPR专利试验平台,也提供了权利要求检索,但完全不敢用来检,漏检误检太严重了。本帖是在讨论欧专局。

欧专局也是有优势的,毕竟里面收集了80多个国家的专利文献,又能看到同族信息。不用欧专的worldwide数据库,那分析全球范围的专利文献只能一个国家一个国家的收集,再汇总,或者买昂贵的商业数据库。

如果只分析中国,或者只分析美国,那从国知局,美专局作为数据源肯定是对的,分析全球,又是免费的数据源,现在还只有欧专的信息量最丰富。(错误多,那是跟信息量成正比的,只能忍了)

但因为欧专的错误太多,就否认不用,看不上以此为数据源做的分析报告,大可不必。动辄就买个商业数据库才开始分析,那也是重复花费。

黑猫白猫能抓到老鼠就是好猫,能在迷宫中不迷路才成。
dzx111  高级会员 | 2010-5-15 00:13:19

Re:我看欧专局的专利数据库

deltajs wrote:
而仅仅利用ti+ab去检索,检索的准确度就很难保证了,我遇到的经常做专利检索的人,都有这感觉。

利用TI+AB是检索的普遍做法,确实有些词只出现在权项+说明书时,就会漏检。而上来就用权项+说明书来查,又会造成误检太多。
比如TI+AB查变速器,可能也就几千件,权项+说明书来查,天,估计少也几万件了。
如果说几万件里面全包括了所需要的全部专利,我相信,但误检也太严重,几万件继续来筛选,又是浩大的工程。

有电子格式全文提供检索的毕竟还是少数国家的专利,大部分都还不能做到“全文检索”
dzx111  高级会员 | 2012-3-30 06:03:38
重新顶起
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|( 冀ICP备05010901号 )|博派知识产权

Powered by Discuz! X3.4 © 2001-2016 Comsenz Inc.

返回顶部