中國(guó)專利文獻(xiàn)權(quán)威文檔(以下簡(jiǎn)稱“權(quán)威文檔”)基于WIPO標(biāo)準(zhǔn)ST.37,包含中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局1985年至今所公開(kāi)的發(fā)明和實(shí)用新型兩種類型各個(gè)公布級(jí)的專利文獻(xiàn)的信息。
權(quán)威文檔可供其他知識(shí)產(chǎn)權(quán)機(jī)構(gòu)(或其他潛在的用戶)評(píng)估其所獲得的中國(guó)專利文獻(xiàn)資源的完整性。權(quán)威文檔的技術(shù)內(nèi)容如下。
1.權(quán)威文檔所包含的信息
權(quán)威文檔中每條中國(guó)專利文獻(xiàn)記錄包含以下四方面信息。
(1)國(guó)別代碼
根據(jù)WIPO標(biāo)準(zhǔn)ST.3,中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局的國(guó)別代碼為CN。
(2)公開(kāi)號(hào)
公開(kāi)號(hào)是指國(guó)家知識(shí)產(chǎn)權(quán)局按照法定程序,在專利申請(qǐng)公布和專利授權(quán)公告時(shí)給予的專利文獻(xiàn)標(biāo)識(shí)號(hào)碼。
權(quán)威文檔中專利文獻(xiàn)號(hào)將忠實(shí)于原始出版。
(3)種類標(biāo)識(shí)代碼
種類標(biāo)識(shí)代碼是指國(guó)家知識(shí)產(chǎn)權(quán)局為標(biāo)識(shí)不同種類的專利文獻(xiàn)而規(guī)定使用的字母代碼,或者字母與數(shù)字的組合代碼。
權(quán)威文檔中種類標(biāo)識(shí)代碼忠實(shí)于原始出版。
(4)公開(kāi)日期
公開(kāi)日期指與專利文獻(xiàn)標(biāo)識(shí)相對(duì)應(yīng)的專利文獻(xiàn)公開(kāi)日期。公開(kāi)日期的格式規(guī)范為YYYYMMDD的形式,其中YYYY為4位數(shù)字表示的年,MM為2位數(shù)字代表的月,DD為2為數(shù)字代表的日。
2.權(quán)威文檔的組織方式
中國(guó)專利文獻(xiàn)權(quán)威文檔按發(fā)明和實(shí)用新型分為兩個(gè)部分,每部分對(duì)應(yīng)一個(gè)文本文件,采用UTF-8字符編碼,其中分別存儲(chǔ)發(fā)明和實(shí)用新型的信息。
2.1 文件名稱
每個(gè)權(quán)威文檔文件的文件名稱采用“專利類型+文獻(xiàn)范圍”二部分信息,二部分信息之間用空格進(jìn)行分隔,其中。
“專利類型”取值為:Invention, utility model,分別代表發(fā)明和實(shí)用新型。
“文獻(xiàn)范圍”為權(quán)威文檔中所包含文獻(xiàn)公開(kāi)時(shí)間的起止范圍,開(kāi)始時(shí)間和結(jié)束時(shí)間之間用字符 “-”進(jìn)行連接。
例如:“INVENTION 19850910-20190630”。表明權(quán)威文檔包含了1985年9月10日至2019年06月30日所出版的中國(guó)發(fā)明專利文獻(xiàn)的信息。
2.2 內(nèi)部結(jié)構(gòu)
權(quán)威文檔的內(nèi)部結(jié)構(gòu)如下。
專利文獻(xiàn)記錄之間以CRLF(回車換行)進(jìn)行分隔;
國(guó)別代碼、專利文獻(xiàn)號(hào)、種類標(biāo)識(shí)代碼、公開(kāi)日期之間用“,”進(jìn)行分隔;
專利文獻(xiàn)記錄按專利文獻(xiàn)號(hào)排序,專利文獻(xiàn)號(hào)相同時(shí),按種類標(biāo)識(shí)代碼排序。
圖1為一個(gè)示例。

圖1:權(quán)威文檔示例