非特許文献 (NPL) 調査と分析は、テクノロジーとイノベーション調査において不可欠な要素です。数々のケーススタディや長年の経験の積み重ねの結果、私たちは、特許調査と非特許文献を組み合わせた分析から、技術動向に関して非常に有益な洞察やより包括的な視点の獲得が可能であると確信しています。
多くの構造化・インデックス付けされたデータベースの利用が可能な特許調査とは異なり、非特許文献は、多様な情報源が広範に散逸、また、情報量も急速に増加しており、その取扱いが大きな課題となっています。
非特許文献 (NPL) 調査 の実施には、次のような独自の課題があります。
- まず情報源のリストを作成し、次に各情報源を対象とした調査を実施する必要があり、非常に時間のかかるプロセスであること。
- 重要な情報源がすべて網羅的に参照されているわけではないため、調査が不完全になる可能性がある。
- 調査の品質や制度に関しては、アナリストに大きく依存する。
- 複数の情報源ごとにアラートが必要なため、アラートの設定に時間を要する。
SciTech Patent Artは、非特許文献(NPL)調査に伴う課題とウェブの動的な性質を念頭に置き、非特許文献(NPL)調査の効率的な実施を可能とする手法を開発しました。
当社のソフトウェアエンジニアチームは、知的財産(IP)業界での豊富な経験を活かして、ツールとソリューションを開発し、テクノロジーやイノベーションに関連する活動を支援しています。
広範に散逸する非特許情報の効率的調査を目的としてSciTech Patent Artが開発したソリューションの一例として、Deep Web検索ツールが挙げられます。
この名前が示すように、ディープウェブ検索とは、Google、Bing、Yahooなどのパブリック検索エンジンではインデックス化されていない情報の検索を指します。
このようなパブリック検索エンジンからアクセスできる情報は「サーフェスウェブ」と呼ばれ、ウェブ情報全体の5%未満です。一方、ウェブの約95%を占めるディープウェブには検索結果の奥深くに埋もれているか、以下の理由によって取得できない情報が含まれています。
- パブリック検索エンジンは、地理的な場所、プロモーションなどに基づいてコンテンツを優先するため、情報の信頼性に影響する可能性がある。
- 所有者の裁量により、インデックスに登録されていないページがある場合がある。
- プライベートなウェブサイトがあり、アクセスするには認証が必要。
- 他の多くのウェブサイトでは、自動化されたデータスクレイピングを防ぐためにCaptchaが必要。
Deep Web検索プラットフォームの開発に向けたSciTech Patent Artのアプローチ
SciTech Patent Artが構築したDeep Web検索プラットフォームは、SciTech Patent Artのソフトウェア エンジニア、情報分析専門家、調査専門家の共同作業から誕生しました。チームは、技術的な専門知識とドメイン固有の知識を結集して、非特許文献 (NPL) 調査 にアクセスするための効率的で包括的なプラットフォームを開発しています。
SciTech Patent ArtのDeep Web検索プラットフォームは、当社の強みに基づいて構築されています。
分野ごとの専門知識
─ 当社の情報分析専門家チームは、化学、高分子科学、食品技術、包装、機械、自動車、医療機器、医薬品、バイオテクノロジー、材料科学、電気・電子、半導体など多岐にわたる技術について深い知識を有しており、ターゲットを絞ったデータソースをキュレートしています。
調査の専門知識
─ 当社の情報分析専門家チームは、多様なデータベースや非特許文献の検索に長年の経験を持っています。彼らは、重要な調査および分析プロジェクトに役立つ関連性の高い技術を抽出するための、創造的な調査戦略を練ることに卓越しています。
データエンジニアリングの専門知識
─ 「ディープウェブ」検索を成功させるには、業界の知識と経験を備えた当社のソフトウェアエンジニアチームが提供するコアデータエンジニアリング機能が必要です。
機械学習の統合
─ さらに、これらのドメイン固有のデータベースには機械学習ベースのアルゴリズムが統合されており、プラットフォームの洗練度が増しています。機械学習アルゴリズムは2つのレベルで開発および統合されています。
- 当社では、情報分析専門家チームがまとめた初期リストに基づいて、機械学習アルゴリズムを使用して、包括的なトピック/テクノロジー固有の同義語リストを開発しています。
- 機械学習アルゴリズムは、同義語リストとコンテキスト情報に基づいて、ドキュメントの分類を自動化するためにも使用されます。
SciTechの非特許文献(NPL)調査へのアプローチにはどのようなメリットがありますか?
カスタマイズされたデータソリューション
─ 当社の情報分析専門家チームとソフトウェアエンジニアのチームの専門知識により、カスタマイズされたクローラーやスクレーパーの開発、データを構造化するアルゴリズムの開発、データ パイプラインの作成などが可能になります。
反復的なデータソリューション
─ Deep Web検索プラットフォームが最新のデータソース、ドキュメント、同義語、テクノロジー情報で定期的に改良および更新されるように、反復的なアプローチが採用されています。