| 掲載巻(発行年) / 号 / 頁 | 50巻(2000年) / 7号 / 1089頁 |
|---|---|
| 論文区分 | 資料 |
| 論文名 | パテントマップ作成ソフトにおける日本語の単語切り出し処理について |
| 著者 | 知的財産情報委員会第3小委員会 |
| 抄録 | 膨大な日本特許情報からオフラインにてパテントマップを作成する際に先ず留意すべきことは、どのような観点から集約するかを最初に慎重に検討する必要があることと、自動的にパテントマップが出来あがるのではなく集約の基本方針またはマトリックスに並べる軸指標は人が関与して決める必要があることを先ず念頭に持つことである。これらの見えない重要な観点を無視すると、機械的に処理して知らないうちに方向を見誤る危険性が潜んでいる。さて、日本特許情報からオフラインにてパテントマップを作成する処理システムには、日本語の処理プロセスの一環として単語切り出しの行程が存在し、各社ともそれぞれ工夫を凝らしている。この処理プロセスについては、カタログの一部に簡単に記載されているものもあるが解りづらい。また、今までこれらの観点にスポットを当てて報告されたものはないようである。一方、オンラインの特許データベースの単語切り出しは、(財)日本特許情報機構が商用サービスしているPATLISⅢにおける抄録文からのキーワード自動切り出しが知られている。そこで、日本特許庁のCD-ROM公報から特許情報をオフラインにて処理してパテントマップを作成することを想定し、オフライン処理にて日本語の単語切り出し機能を有するソフトまたはサービスを1999年8月末時点の調査にもとづき、実際に市販しているベンダー2社を選んだ。また、最近のパソコン性能の向上により単語切り出し処理時間が短くなり、特許情報のオフライン処理も日常的にできるようになった。このような状況を鑑み、本資料では、CD-ROM公報から特許情報の単語切り出しがオフライン処理可能な2ベンダーの日本語切り出し機能と、オンライン処理のPATLISⅢの現在の単語切り出し機能と、および参考として以前のPATLISⅡで利用され、現在も市販サービスしているものの4つの単語切り出しシステムについて比較検討したので報告する。本資料では、具体的な2例のサンプル・データから実際に得られた単語切り出し生データを比較検討した結果について報告する。その結果、パテントマップを作成しようとする際にはその基本ルールを把握することが大事であり、基本ルールの一つである日本語の単語切り出し処理についてもPATLISⅢと同様だろうと安易に推定せずに調べてみることが重要であると判明した。各ベンダーより紹介された単語切り出し機能とは異なる観点から検討すると、日本語の単語切り出しの微妙な差異が浮かび上がってきた。これらの差異を意識しながら日本の特許情報のパテントマップを作成することが、パテントマップの質の向上から見ると極めて重要であると考える。 |
