唯一的檢索系統(tǒng)-patentics(企業(yè)版).ppt
《唯一的檢索系統(tǒng)-patentics(企業(yè)版).ppt》由會員分享,可在線閱讀,更多相關(guān)《唯一的檢索系統(tǒng)-patentics(企業(yè)版).ppt(45頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1,唯一的檢索系統(tǒng)-patentics,,Patentics創(chuàng)新,P為當今世界上僅有可以自動理解全世界專利的第一個超大型概念搜索引擎;在搜索(包括專利)歷史上的首次,Patentics的自動計算排序結(jié)果,與全世界專利審查員遞交PCT的X/Y/A搜索報告進行大規(guī)模比對;統(tǒng)計測試比對包括全部USPTO2000-2009年遞交PCT共133,126篇(英文);EPO2000-2009年遞交PCT共122,301篇(英文);JPO2000-2009年遞交PCT共114,953篇(英文);KIPO2001-2009年遞交PCT共16,839篇(英文);SIPO2004-2009年遞交PCT共15,522篇(中、英文)。,2,核心思想,“R/”:將檢索結(jié)果根據(jù)某個語義來排序。可以在檢索結(jié)果非常多的情況下將最相關(guān)的文獻呈現(xiàn)到最前面。是與傳統(tǒng)檢索系統(tǒng)的主要區(qū)別;大幅提升檢索效果的主要手段。,第一步:不輸入任何檢索要素,直接對數(shù)據(jù)庫中的所有結(jié)果排序。大量統(tǒng)計分析表明有50%的案子能夠很容易獲得對比文件。R/CN101091890anddi/2007-07-26sipo審查員給出的X對比文件(CN1857239)排在第一位。瀏覽1篇文獻即可獲得對比文件,完成檢索需要5分鐘。,第一類任務(50%案子),5,第一步:r/cn101079912anddi/20070711,直接對所有專利排序,假設(shè),感覺排在前面的專利不太合適,無法用作對比文件。注:受傳統(tǒng)系統(tǒng)限制,PCT檢索報告,用了10個以上的關(guān)鍵詞來限定,第二類任務(40%案子),6,第二步:只需要使用一個關(guān)鍵詞“氣味”,獲得21222篇文獻,然后系統(tǒng)自動根據(jù)與本案的語義相關(guān)度排序,審查員給出的X對比文件(CN1727009;CN1568083;CN1484163)都排在第一屏。約40%的案子可以用這樣的簡單策略完成檢索。這類檢索平均耗時1小時。,7,第三類任務(10%案子),第一步:直接對所有專利排序,假設(shè),感覺排在前面的專利不太合適,無法用作對比文件。,第二步:增加一個關(guān)鍵詞作為限定,假設(shè),感覺排在前面的專利還是不太合適。,第三步:再增加一個關(guān)鍵詞,PCT檢索報告中給出的對比文件位于前列。,8,成為唯一選擇的原因,唯一選擇是只用這個,而不需要再使用其他檢索系統(tǒng)。唯一選擇是所有案子都用,而不是部分案子用。唯一選擇是所有用戶都可以用,而不是有很高檢索經(jīng)驗的人用。,9,成為唯一選擇的原因,數(shù)據(jù)量6,256,574篇美國授權(quán)/申請全文:1971/4/13~2009/12/82,943,534篇中國發(fā)明/實用申請全文:1985/9/10~2009/12/21,270,475篇EP申請全文:1978/12/20~2009/7/221,275,752篇WO申請全文:1978/12/7~2009/7/929,406,252篇42國英文摘要:1900/1/2~2009/7/30并實時更新。多于SIPO+EPO+USPTO+出版社全文,10,成為唯一選擇的原因,任何系統(tǒng)漏檢的原因檢索要素是漏檢之源。檢索要素用于從全部數(shù)據(jù)中劃分出一部分數(shù)據(jù),任何的考慮不周都會導致一部分合適的結(jié)果沒有被劃分進入。遺憾的是,考慮不周無法避免。,成為唯一選擇的原因,審查員檢索過程:,審查員在常規(guī)檢索系統(tǒng)中,需要將多個檢索要素相與,從而將檢索結(jié)果限定到可閱讀的范圍。“錢包”的各種表達形式,已經(jīng)導至漏檢的可能性不可避免!,12,成為唯一選擇的原因,漏檢的計算傳統(tǒng)系統(tǒng)中為了將檢索結(jié)果限定到合理的范圍需要多個檢索要素的組合。四個檢索要素是非常常見的:檢索要素A*檢索要素B*檢索要素C*檢索要素D熟練檢索員:90%*90%*90%*90%=66%(漏檢34%)普通檢索員:80%*80%*80%*80%=41%(漏檢59%),13,成為唯一選擇的原因,Patentics的原理:有了語義技術(shù)以后,就不需要將檢索結(jié)果限定都合理的范圍,所以不用很多檢索要素。不用或用很少的檢索要素,通過語義對大量文獻排序,最相關(guān)的就會呈現(xiàn)在所有結(jié)果的最上面。,14,成為唯一選擇的原因,PATENTICS絕大部分案子不需要任何檢索要素(約50%)或只用一個檢索要素(約40%),很少一部分需要用多個檢索要素(約10%)。避免漏檢的能力成倍提高。理論上的最壞極端情況(幾乎不會出現(xiàn)):常規(guī)檢索系統(tǒng)用幾個檢索要素,我們也用幾個。漏檢的可能性相同。,15,成為唯一選擇的原因,瀏覽效率提高常規(guī)系統(tǒng)的檢索結(jié)果是根據(jù)公開時間排序的,即使獲得100個結(jié)果,也許可用的結(jié)果會在70位,則需要瀏覽70個才發(fā)現(xiàn);而PATENTICS通過語義排序后,最相關(guān)的在最前面,瀏覽效率大大提高。,案例:CN1989859特別用于運動鞋的內(nèi)靴權(quán)1:一種內(nèi)靴,特別地用于運動鞋諸如滑雪鞋、直排輪旱冰鞋或滑冰鞋,包括前部(2)和后部(6),前部覆蓋使用者的腳趾和前腳部分,后部在腳弓到腳跟的區(qū)域延伸;前部(2)通過一個或多個相互連接波紋帶(14)連接到后部(6),波紋帶(14)在靜止位置具有最大伸長量。,成為唯一選擇的原因,審查員的檢索過程:(belloworbellowsorflexibleordeformable)and(innerorinside)and(A43B5/16ORA43B5/04ORA43B5/18)/IC對比文件是:EP0308368(同族US4893417),US4268931,成為唯一選擇的原因,在patentics中也可用同樣的檢索式檢索所有中/英文專利;如果是根據(jù)公開日排序的話,該對比文件出現(xiàn)在280多位;而同樣的檢索結(jié)果,根據(jù)該案的語義排序,該對比文件出現(xiàn)在第6位。僅僅需要瀏覽1/50的文檔。瀏覽效率提高50倍。,(B/belloworB/bellowsorB/flexibleorB/deformable)and(B/innerorB/inside)ANDICL/(A43B5/16ORA43B5/04ORA43B5/18)ANDR/CN1989859ANDDI/20051229,其實,我們不輸入任何檢索要素也能獲得該對比文件!,也僅需要瀏覽13篇即可獲得,瀏覽效率是傳統(tǒng)方法的20多倍!節(jié)省傳統(tǒng)復雜檢索表達式的嘗試、瀏覽過程,檢少漏檢可能!,,更多X文獻可能在這里,即那些在傳統(tǒng)方法中可能漏檢的,中國公開號直接輸入,直接選英文庫,?,21,成為唯一選擇的原因,對用戶的要求常規(guī)系統(tǒng)需要組合多個檢索要素,每個檢索要素中還包括一個或多個關(guān)鍵詞和/或分類號,難度很大。Patentics:如果直接輸入公開號獲得對比文件,不需要任何經(jīng)驗的人都會;如果需要一兩個檢索要素的,通過今天的培訓都會。,22,成為唯一選擇的原因,通過實測來證明Patentics的正確性!通過實測來給用戶信心!大量統(tǒng)計數(shù)據(jù)證明1分析了SIPO2004-2009所做的15522個PCT檢索,其中的中文XY對比文件,我們的機器自動對所有300多萬篇中國專利排序,不需要任何人的智慧,就能容易獲得很多對比文件。效果是非常驚人的。,統(tǒng)計測試結(jié)果,全部:6603個X引用;命中:4051個(61%);沒有命中:2552個(39%);TOP1:395個5.98%第一位置TOP20:1674個25.35%第一屏TOP100:2831個41.0980%前5屏TOP400:4051個61.35%前20屏不需任何檢索策略,盡輸入一專利公開號,Patentics智能排序引擎,能實現(xiàn);6%可能排序第一位置的是審查員心目中的X文獻;25%可能在第一屏發(fā)現(xiàn)X文獻;41%可能在前五屏發(fā)現(xiàn)X文獻!,23,24,成為唯一選擇的原因,證據(jù)證明2:傳統(tǒng)系統(tǒng)存在大量漏檢,patentics能幫助改善很多SIPO復審委的無效決定中給出的新對比文件,在patentics中位于前列;,25,全面解決問題的方法,基礎(chǔ)模式:用檢索要素限定范圍或不限定范圍andr/排序基準,26,全面解決問題的方法,排序基準:就是你想讓什么樣的文獻排在最上面,如果是查新檢索,我們當然希望與案子最相關(guān)的在最上面,所以排序基準就是該案子的整個文檔,排序基準的文本內(nèi)容越多,排序效果越好;普通檢索建議直接用公開號做排序基準;如果是PCT檢索還沒有文本,那么可以手工輸入摘要或權(quán)利要求等內(nèi)容作為排序基準;在英文庫也可以用中國專利作為排序基準。,27,全面解決問題的方法,用檢索要素限定范圍或不限定范圍;能限定范圍就限定范圍,主要采用關(guān)鍵詞(常規(guī)檢索系統(tǒng)具有的檢索功能,patentics都具有,各種分類號,連詞符,截詞符等都可以用);無法限定范圍或不想限定范圍就什么都不做,不限定就是對所有文獻排序,取400個最相關(guān)的排出。,28,全面解決問題的方法,推介的方法:1)先不限定范圍,直接用公開號對所有專利排序,看看排在前面的是否直接能用,有的話檢索結(jié)束。2)然后,采用B/關(guān)鍵詞andr/公開號限定出一個范圍,可能是幾萬篇或幾千篇,再用案子排序。,29,全面解決問題的方法,關(guān)鍵詞選擇原則:不一定要是發(fā)明點原則是要能有一定的限定功能,且盡可能不導致漏檢,通俗的說就是我想要的對比文件中一定會出現(xiàn)的詞。,30,全面解決問題的方法,中國專利公開號:CN1728450用于移動終端的天線支架,優(yōu)先權(quán)日20040721檢索員通過分析申請,認為對比文件中必須包含這兩個詞:antenna和rotatable用這兩個關(guān)鍵詞在美國申請和美國專利庫中獲得公開日在20040721前的5251項結(jié)果。常規(guī)檢索系統(tǒng)中,檢索員還必須進一步限定。否則無法閱讀。如果用戶需要增加移動電話這個檢索要素,所以輸入了關(guān)鍵詞MOBILE。就會導致US5771466的漏檢,US5771466中沒有用MOBILE這個詞,而是“Portableradiotransceiver”。檢索要素越多,漏檢的可能越大。而PATENTICS不需要進一步限定,可以將獲得的5251項結(jié)果根據(jù)CN1728450來排序。即:(B/antennaANDB/rotatable)andR/CN1728450andDI/20040721檢索結(jié)果還是5251項,但是最相關(guān)跑到了前面。US5771466位于第二位。,步驟一:直接輸入公開號即可獲得50%的對比文件。US6445611是SIPO漏檢,而EPO獲得的X對比文件。這類檢索平均耗時半小時。,步驟一:直接輸入專利號,瀏覽前面的文檔,如果覺得沒有合適的,則進入步驟二。步驟二:增加一個關(guān)鍵詞,“氯化血紅素”,X文獻就位于第一位了。如果用戶熟練以后,能夠判斷對比文件中必須要包括“氯化血紅素”這個詞,也可以直接使用步驟二。有40%的對比文件可以通過這種方法獲得。這類檢索平均耗時1小時。,33,步驟二:如果要找抵觸申請,時間限制可以選擇申請日“da”。,步驟二:如果用戶認為必須要在摘要中出現(xiàn)某個關(guān)鍵詞,才有可能是對比文件,則可以通過ab/,在摘要中限定某個關(guān)鍵詞。,步驟一:直接輸入公開號,瀏覽前面的文獻,如果覺得沒有獲得XY文獻,則進入步驟二。步驟二:r/CN1665545anddi/20020705andb/腫瘤,還是沒有獲得對比文件,則在添加一個關(guān)鍵詞。步驟三:r/CN1665545anddi/20020705andb/腫瘤andb/鹽酸。10%的對比文件通過這類方式獲得。約耗時1.5小時。,36,全面解決問題的方法,幾個常用功能的介紹關(guān)鍵詞擴充;全文閱讀,高亮顯示;輸入文檔作為排序基準。,37,世界上最智能中/英關(guān)鍵詞擴充,選中文從中國專利庫中自動聯(lián)想,選英文從英文專利庫中自動聯(lián)想,38,全文閱讀,高亮顯示,在此篇沒有出現(xiàn),點擊此處瀏覽全文,39,輸入文檔作為排序基準,三種輸入方法:1)手工輸入2)從本地的文件導入3)從web導入,40,輸入文檔作為排序基準,文檔號U1等同于專利公開號,可以作為排序基礎(chǔ),可開展的檢索業(yè)務,無效檢索分析自己已公開案例的查新檢索分析對手已公開案例的查新檢索分析專利技術(shù)資料檢索侵權(quán)檢索未公開案例的查新檢索分析自動檢索與技術(shù)標準相關(guān)的專利本公司未公開專利申請的檢索,專利技術(shù)資料檢索;侵權(quán)檢索,未公開案例的查新檢索分析;自動檢索與技術(shù)標準相關(guān)的專利,U1-U5都是用戶自己的文檔,這些文檔可以是用戶自己的專利申請,在下一個專利申請時可以先檢索一下該專利與自己之前申請的是否有沖突。這個功能是其他檢索系統(tǒng)所無法提供的。,更多信息請瀏覽,感謝關(guān)注、傳播,- 1.請仔細閱讀文檔,確保文檔完整性,對于不預覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認領(lǐng)!既往收益都歸您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 唯一 檢索系統(tǒng) patentics 企業(yè)版
鏈接地址:http://www.3dchina-expo.com/p-11496072.html