Deep Web(ディープウェブ)検索と人工知能を活用した包括的な非特許文献調査
非特許情報(NPL)の検索と分析は、技術やイノベーションの研究に不可欠な作業です。豊富な事例と長年の経験の結果、特許文献調査に加え多様な非特許情報分析を組み合わせることで、戦略立案に役立つ貴重な洞察や技術動向に関する包括的な情報が得られると、私たちは確信しています。
高度に構造化、検索付けされたデータベースの利用が可能な特許情報検索と異なり、以下に例示するように多様な情報源が存在する上に、膨大な情報が広範に散逸、また、その情報量も急速に増加している非特許情報を対象とした網羅的な調査は大きな課題です。
- 科学文献(専門誌、各種記事、研究論文、等)
- ビジネスや企業に関する記事やウェブサイト情報
- 製品マニュアルや仕様書
- 各種会議やセミナー等における配布物
- 臨床試験
- 規制、法規制、コンプライアンスなどに関する文書、等
多様な非特許情報を対象とした網羅的調査は、次のような目的を狙いとする調査において有益です。
- 網羅的な技術調査: 最新の技術開発動向、各社の取組や戦略に関する洞察を提供します。
- 特許性評価: 当該発明に対する特許性評価を目的とした先行技術に対する進歩性や新規性の評価
- 無効資料調査: 他社特許の無効化、或いは自社特許の有効性調査において、非特許情報に対する網羅的調査は重要な意味を持ちます。
- 市場調査: 市場や業界に関する有益な情報や洞察、消費者動向、新興する技術、等の理解を得る上で広範な非特許情報に対する分析は有用です。
- 製品ランドスケープ分析: 競合他社の新製品や製品開発戦略の推測において、非特許情報に対する分析が有効です。
- 競合分析: 特定事業領域における競合他社の技術開発戦略や事業戦略、他社との連携、技術導入、等の広範な情報を非特許情報分析から得ることで、競争優位を保つための合理的、客観的意思決定が可能となります。
- 連携先の特定や外部人材採用: 非特許情報を対象とした調査は、潜在的連携先、M&Aターゲット、特定技術領域における有力な研究者、等を特定するような目的にも活用が可能です。
上記のように、非特許情報を対象とした調査分析からは、企業が持つ様々な課題に対して有益な洞察や気付きの獲得が期待される一方、調査の実施においては、以下のような課題や困難が考えられます。
- 数多く存在する情報源の中から調査対象とする関連度の高い情報源の探索、それに続いて各情報源に対する検索が必要となり、非常に時間のかかるプロセスとなります。
- 有益な情報が含まれるすべての情報源の洗出しは困難な為、結果として不完全な調査で終わる可能性があります。
- 調査結果の品質は、調査を担当するアナリストの調査スキルや技術に対する理解度により大きく影響されます。
- 特定の対象に関して継続的な調査が必要な場合、調査対象とする複数の情報源ごとにアラート機能を設置する必要があり、この作業にも時間を要します。
SciTech Patent Artは、非特許文献検索に付随する上記のような課題、及びウェブ情報に特有な動的な側面を念頭に、効率的な非特許情報検索を可能とする独自の手法を開発いたしました。
SciTechのITチームは、知財や技術に関する調査分析作業に対する豊富な経験と知識を活かし、特許及び非特許情報の調査分析支援、調査分析の結果得られる有益な情報の効率的活用を支援する様々なツールやソリューションを開発して参りました。
その一例が、ウェブ情報の効率的な検索を可能とする Deep Web検索ツールです。 Deep Web検索ツールを活用することで、Google、Bing、Yahooなどの公共の検索エンジンでは容易に検索し得ないインデックス化されていないウェブ情報の検索を効率的に行うことが可能となります。 一般的にSurface Webと呼ばれるこれら公共の検索エンジンを通じて容易にアクセスできる情報量は5%前後です。
Surface Webの下層には約95%の情報が存在しており、そのうちの大半を占めるDeep Web情報に対する効率的検索が期待される一方、以下のような理由から容易にアクセスできない情報が含まれています。
- 公共の検索エンジンは、地理的理由、プロモーションなどに基づいてコンテンツに優先順位を付与する為、情報の信頼性に影響を与える可能性が考えられます。
- オーナーの判断によりインデックスされていないページも存在します。
- 一部の非公開のウェブサイトへのアクセスには認証が必要な場合があります。
- 多くのウェブサイトでは、自動データスクレイピングを防ぐためキャプチャが必要となります。
以下に、ウェブ情報の構成やDeep Web情報にアクセスする上での課題、Deep Web検索ツールの機能について図示させて頂いております。
Deep Web検索プラットフォームの基本コンセプトには、SciTech社内のITエンジニアリングチームに加え、情報処理及び情報検索に関するエキスパートの知恵が結集されています。 調査対象となる各技術に関する専門知識と技術分野固有の知識を集積し、非特許情報にアクセス、調査する上で効率的且つ包括的なプラットフォームを開発致します。
SciTechのDeep Web検索プラットフォームは、以下のような特長を有しています。
個別技術分野に対する専門知識: 弊社のアナリストは、化学、高分子化学、食品技術、包装技術、機械、自動車、医療機器、医薬、バイオ、材料、電気・電子、半導体、等、広範な技術領域に対する高い専門知識を有しており、調査対象に対して関連性の高い情報源を効率的に特定することが出来ます。
情報検索能力: 当社の調査分析チームは、多種のデータベース及び非特許情報源を対象とした調査において豊富な経験を有しています。 難度の高い調査プロジェクトにおいて、有益な情報を効率的に抽出するための調査アプローチや創造的な企画提案力を有しています。
データエンジニアリング能力: 特許情報や技術情報を対象とした分析に固有の専門知識や経験が豊富なソフトウェアエンジニアチームにより提供されるデータエンジニアリング能力により、Deep Web検索の効率的な運用が可能となります。
機械学習技術の統合: 更に機械学習ベースのアルゴリズムが、これらのドメイン固有のデータベースに統合され、プラットフォームの能力が更に洗練されています。 機械学習アルゴリズムの開発と統合は以下の2つの段階から構成されています。
- 各技術に精通するアナリスト・チームにより構築された初期リストに基づいて、調査対象トピックや技術に固有の同義語リストを作成。
- 機械学習のアルゴリズムは、同義語リストと文脈(コンテクスト)情報に基づいて文献の分類を自動化する為にも使用されます。
カスタム仕様のデータソリューション: 技術に精通するアナリストとソフトウェアエンジニアの専門知識を活用することで、カスタム仕様のクローラーやスクレイパーの開発、データを構造化する為のアルゴリズム、データパイプラインの作成などが可能となります。
反復的なデータソリューション: ディープWeb検索プラットフォームは定期的に改良され、また、最新の情報源、ドキュメント、同義語、技術情報で更新されるよう、反復的なアプローチが採用されています。
ディープWeb検索プラットフォームには次のような利点があります。
- ディープWeb検索プラットフォームは、高度にコンテクスト化され、また、個別技術に特化して開発されている為、それら特定技術に関連する有益な洞察を提供することが可能となります。
- このデータベースの開発を支える各分野のエキスパートの知恵と協業により、大規模なデータセットの効率的検索及び分類を可能とする最新技術が提供されています。
上記のようなSciTech独自の技術に基づく非特許情報分析事例としては、以下のようなものがございます。 独自開発のツールと各技術に精通したアナリストのスキルとの融合によるSciTech独自の非特許情報調査分析手法により、多大なリソースの投入が必要となる以下のような調査プロジェクトの実施の効率的実施が可能となります。
- 特定の医療技術分野を対象として、その分野で世界中の研究者が取り組んでいる主要な課題に対する包括的な理解を目的として、医療技術分野における主要なジャーナルに掲載されている5,000以上の文献を分析。
- 高度なデータ処理技術を活用し、特定のデバイス技術に関する30,000件を超える学術論文を分析、カスタム仕様で分類された詳細かつ包括的なデータベースを構築。
- 多様なデータベースやリソースにアクセス、特定の技術研究に取り組んでいる世界中の研究者、スタートアップ企業、大学や研究機関を抽出。
- 5,000件レベルのプロジェクトを網羅するデータベースに対して、様々な角度からビッグデータ分析を実施、特定の傾向や洞察を抽出。
SciTechの提供する非特許情報調査分析サービスに対するご関心やご質問、更に具体的なご説明等の要望がございましたら、以下からご連絡ください。 皆様のご連絡をお待ち申し上げております。