「知財管理」誌

Vol.50 記事詳細

掲載巻(発行年) / 号 / 頁 50巻(2000年) / 7号 / 1089頁
論文区分 資料
論文名 パテントマップ作成ソフトにおける日本語の単語切り出し処理について
著者 知的財産情報委員会第3小委員会
抄録 膨大な日本特許情報からオフラインにてパテントマップを作成する際に先ず留意すべきことは、どのような観点から集約するかを最初に慎重に検討する必要があることと、自動的にパテントマップが出来あがるのではなく集約の基本方針またはマトリックスに並べる軸指標は人が関与して決める必要があることを先ず念頭に持つことである。これらの見えない重要な観点を無視すると、機械的に処理して知らないうちに方向を見誤る危険性が潜んでいる。さて、日本特許情報からオフラインにてパテントマップを作成する処理システムには、日本語の処理プロセスの一環として単語切り出しの行程が存在し、各社ともそれぞれ工夫を凝らしている。この処理プロセスについては、カタログの一部に簡単に記載されているものもあるが解りづらい。また、今までこれらの観点にスポットを当てて報告されたものはないようである。一方、オンラインの特許データベースの単語切り出しは、(財)日本特許情報機構が商用サービスしているPATLIS靴砲ける抄録文からのキーワード自動切り出しが知られている。そこで、日本特許庁のCD-ROM公報から特許情報をオフラインにて処理してパテントマップを作成することを想定し、オフライン処理にて日本語の単語切り出し機能を有するソフトまたはサービスを1999年8月末時点の調査にもとづき、実際に市販しているベンダー2社を選んだ。また、最近のパソコン性能の向上により単語切り出し処理時間が短くなり、特許情報のオフライン処理も日常的にできるようになった。このような状況を鑑み、本資料では、CD-ROM公報から特許情報の単語切り出しがオフライン処理可能な2ベンダーの日本語切り出し機能と、オンライン処理のPATLIS靴慮什澆涼姥貔擇蟒个卦’修函△よび参考として以前のPATLIS兇罵用され、現在も市販サービスしているものの4つの単語切り出しシステムについて比較検討したので報告する。本資料では、具体的な2例のサンプル・データから実際に得られた単語切り出し生データを比較検討した結果について報告する。その結果、パテントマップを作成しようとする際にはその基本ルールを把握することが大事であり、基本ルールの一つである日本語の単語切り出し処理についてもPATLIS靴汎瑛佑世蹐Δ醗属廚某篦蠅擦困膨瓦戮討澆襪海箸重要であると判明した。各ベンダーより紹介された単語切り出し機能とは異なる観点から検討すると、日本語の単語切り出しの微妙な差異が浮かび上がってきた。これらの差異を意識しながら日本の特許情報のパテントマップを作成することが、パテントマップの質の向上から見ると極めて重要であると考える。
Copyright (C) Japan Intellectual Property Association All Rights Reserved.