中國專利文獻權威文檔(以下簡稱“權威文檔”)基于WIPO標準ST.37,包含中國國家知識產權局1985年至今所公開的發明和實用新型兩種類型各個公布級的專利文獻的信息。
權威文檔可供其他知識產權機構(或其他潛在的用戶)評估其所獲得的中國專利文獻資源的完整性。權威文檔的技術內容如下。
1.權威文檔所包含的信息
權威文檔中每條中國專利文獻記錄包含以下四方面信息。
(1)國別代碼
根據WIPO標準ST.3,中國國家知識產權局的國別代碼為CN。
(2)公開號
公開號是指國家知識產權局按照法定程序,在專利申請公布和專利授權公告時給予的專利文獻標識號碼。
權威文檔中專利文獻號將忠實于原始出版。
(3)種類標識代碼
種類標識代碼是指國家知識產權局為標識不同種類的專利文獻而規定使用的字母代碼,或者字母與數字的組合代碼。
權威文檔中種類標識代碼忠實于原始出版。
(4)公開日期
公開日期指與專利文獻標識相對應的專利文獻公開日期。公開日期的格式規范為YYYYMMDD的形式,其中YYYY為4位數字表示的年,MM為2位數字代表的月,DD為2為數字代表的日。
2.權威文檔的組織方式
中國專利文獻權威文檔按發明和實用新型分為兩個部分,每部分對應一個文本文件,采用UTF-8字符編碼,其中分別存儲發明和實用新型的信息。
2.1 文件名稱
每個權威文檔文件的文件名稱采用“專利類型+文獻范圍”二部分信息,二部分信息之間用空格進行分隔,其中。
“專利類型”取值為:Invention, utility model,分別代表發明和實用新型。
“文獻范圍”為權威文檔中所包含文獻公開時間的起止范圍,開始時間和結束時間之間用字符 “-”進行連接。
例如:“INVENTION 19850910-20190630”。表明權威文檔包含了1985年9月10日至2019年06月30日所出版的中國發明專利文獻的信息。
2.2 內部結構
權威文檔的內部結構如下。
專利文獻記錄之間以CRLF(回車換行)進行分隔;
國別代碼、專利文獻號、種類標識代碼、公開日期之間用“,”進行分隔;
專利文獻記錄按專利文獻號排序,專利文獻號相同時,按種類標識代碼排序。
圖1為一個示例。
圖1:權威文檔示例