このエントリーをはてなブックマークに追加

一から始める知財戦略

知的財産全般について言及します。

AI関連発明のシンポジウム雑感

f:id:crysade:20191121190814j:plain

 久々のシンポジウムということで、「国際特許審査実務シンポジウム―AI関連発明のグローバルな権利取得に向けて―」に参加してきました。  まぁ例のごとくのAIネタですが、昨年の事例集あたりから特許庁も本腰を入れてきている感じですね。他国もやはり同様のようで、各国の審査については、ある程度共通の見解が確立されてきたのかなという印象は持ちました。

 割と話題になった学習済みモデルのクレームですが、やはり日本以外は中々難しそうですね。プログラムも各国万能とは言えませんし、やはり情報処理装置(デバイス)記載が安定かな。質問としても出ていましたが権利行使の時にどうなるかも分かりませんからね。

 いずれにせよ、明細書の中をある程度固めておけば、修正である程度対応できるレベルだとは思うので、結局は、明細書にどこまできちんと記載を行うかという話になりそうです。少なくとも、細かいロジックの部分で特許権を取得したいのであれば、従来のソフトウェアの明細書よりは若干詳細は必要になると思うのですが、実際どの程度の記載で内部ロジックのクレームを認めるかについては、審査官によってもかなり幅がありそうという印象です。個人的には、内部ロジックの特許権は原則あまり勧めない方向で対応するので、大きな変化はありませんが、出願する場合には、悩ましいですね。  また、今回は、通常の本会場とは別にサテライト会場と言うものが用意されていました。私はサテライト会場で聴講していたのですが、作業スペースは確保できるし、イスは座り易いし、非常に快適でした(ただし、日本語のみ+質問不可)。

 ただし、特許庁主催のシンポジウムなので当然といえば当然なのですが、やはり(企業を含む)実務的な話についてはほとんどありませんでした。実際、AIの場合は、応用領域でこそ知財が活きるのは明らかですし、色々考えなければならないことがありますね。一応、1月末にセミナーをAIネタで講演をする機会を頂けるようなので、そこで少し実務的な方法論や戦略論についての新しいネタを披露できればなぁと思っています。取り敢えず、今日はこの辺で。

 

 

書籍紹介(ビットコインとブロックチェーン:暗号通貨を支える技術)

f:id:crysade:20191117115450j:plain


1.はじめに

 今回は、新しい企画です。知人に書籍レビューみたいなものをやってはどうか、という提案を受けていましたので、その提案に乗っかる形になります。

 

ビットコインとブロックチェーン:暗号通貨を支える技術

アンドレアス・M・アントノプロス(著)今井崇也(翻訳)鳩貝敦一郎(翻訳)

Amazonリンク

 

 ご紹介するのはこちらの書籍です。昨年の今頃からブロックチェーンの勉強を本格的にしようかなぁと思い購入していたものの、読むのを先延ばしにしてしまっていた書籍です。分量的にも内容的にも専門外の人間が業務外で読むには結構厳しいかなぁという気はしますが、退職を良い事に一気に読破しました。

 

2.内容詳細

 所要時間:約20~30時間程度

 ターゲット:大学院生~エンジニア初級

 満足度:4.5/5

 感想:良くも悪くも「ビットコイン」に関連する内容が記載されている書籍でした。ビットコインの歴史から実装に至るまで十分に記載が充実しており、圧倒的に理解が進みました。多くの方がレビューしているように(技術的な)基本を押さえる上での必読書という位置づけかと思います。また、簡易なコードで例が示されていたり、ビットコインシステムの実装や応用についての記載が含まれていたりと、完全な理論というよりは実装を意識した記載になっている気がします。

 ただ、あくまでも技術書という位置づけのため、知財関係者を含めた専門外の人間にとっては不要な知識も結構あるかもしれません。正直、通常の知財関係者であれば前半1章~2章の部分だけでも十分なように思います。そのような場合は、簡易版も発売されているようですから、そちらでも良いかもしれません。

 また、冒頭で記載したように、この書籍はあくまでも「ビットコイン」に特化した内容になっているため、例えば、単純にブロックチェーン技術や分散型システムの応用や実装、近年むしろ重要な「イーサリアム」等については、別途、補足が必要かなと感じました。私自身も、そこら辺についてはもう少し知識を補完していく予定です。

 

3.まとめ

 初めての企画でしたが、どうですかね。好評であればまたこのようなテーマを採用したいと思います(私の本を読むスピードが追いつくかどうかは分かりませんが)。取り合えず、今日はこの辺で。

 

「先行技術調査と権利侵害調査」の違い

f:id:crysade:20191113180507j:plain


1.はじめに

 皆さま、お気づきのことかとは思いますが、ブログの更新頻度が下がっていますw

 理由は当然、新規事務所の立ち上げのため色々と奔走している訳ですが、少しづつ仕事が入ってきていることもあり、中々思うように作業が進みません。正式に公開できるのはやはり12月になりそうです。一から何かを始めるというのはやはり色々と大変ですね。

 さて、それは言っても一つ面白いネタを見つけたので、気合を入れてブログを書くことにします。テーマはずばり「先行技術調査と権利侵害調査」の違いです。実は、これ私がつけた題目ではなく検索技術者検定という試験の過去問題です。ネットで論点まで公表されていたので、面白そうなので、実務的な観点も踏まえて検討をしてみることにします。

www.jstage.jst.go.jp

 

2.問題

 具体的な問題は以下の通りです。

・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・

 出願前の先行技術調査と権利侵害調査について以下の問いに答えなさい。

 それぞれの調査目的を違いがわかるように説明しなさい。

 それぞれの調査において,検索式を作成する場合の注意点を違いが分かるように説明しなさい。説明には「再現率」,「適合率」の用語を必ず用いなさい。

 「再現率」,「適合率」の意味を説明しなさい。

 それぞれの調査において,作成した集合をスクリーニングする際の注意点を違いが分かるように説明しなさい。

・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・

 ぱっと見で、めちゃくちゃいい問題ですね。数学的な知識と特許の知識いずれもある程度見ることができますし、必要な項目を論理的に説明できるかどうかを問う点も良いですね。さて、これを即答できる実務家(サーチャー)はどのくらい居るでしょうかね(笑)。

 ちなみに再現率と適合率の意味自体はすぐにイメージできましたが、用語自体は知りませんでした。もしかしたら、大学院の講義でやっていそうな気はするけど、どうでしょうね。

 

3.解答

 これに対して、解答例がこちらです。

<ポイント1>

 例えば,以下の内容について,それぞれの違いが説明されていること。

・出願前の先行技術調査の目的は,完成した発明の特許性の有無を評価することである。

・権利侵害調査の目的は,事業実施に先駆けて他社権利の侵害の有無を確認することである。

 

<ポイント2>

 例えば,以下の内容について,それぞれの検索式作成時の注意点が説明されていること。

・出願前の先行技術調査は,その調査目的に鑑みて調査効率を重視する必要がある。そのため,適合率を上げる工夫が必要となる。したがって,むやみに調査範囲を広げるのではなく,発明を構成する要素を限定して検索範囲を絞るような検索式にする

・出願前の先行技術調査では,生死の状況にかかわらず,特許を調査対象とする。

・出願前の先行技術調査では,調査期間(遡及期間)は原則として限定しない。

・権利侵害調査は,他社の特許について漏れを生じさせないよう,再現率を上げる工夫が必要となる。したがって,多少のノイズが含まれるとしても検索条件を広めに設定する。

⇒(コメント)理屈としては、この通り実際に再現率を上げる工夫は、それこそケースバイケースですね。また結局、真値は不明ですから料金や調査範囲との関係も重要です。割とスキルの差が出やすいかもしれませんね。

・権利侵害調査では,公知技術の範囲まで広げる必要はなく,実施内容のうち権利侵害の対象となる観点を明確にしておく必要がある。

⇒(コメント)実務上一番問題になる部分ですね。調査結果は、あくまでも対象の観点についての結果であるという点は、十分に理解する必要があるし、(クライアント等に対して)理解させる必要がある部分です。

・権利侵害調査では,調査実行時において生存している特許を調査対象とする。

・権利侵害調査の調査期間(遡及期間)は,原則として権利存続期間(日本特許では出願から20年)とする。

⇒(コメント)ここら辺は当たり前ですね。弁理士やサーチャーでなくても最低限把握しておいてほしいところです。

 

<ポイント3>

 例えば,以下の内容について説明されていること。

再現率とは,検索対象集合の中にある適合レコードをどのくらい検索することができたかという比率である

適合率は精度ともいい,ヒットした回答集合の中に適合レコードがどのくらい入っていたかという比率である

⇒(コメント)権利侵害調査において、結局、真値はわかりませんから中々難しいところですね。興味がある方は、別途、勉強してみてもいいかもしれません。

<ポイント4>

 例えば,以下の内容について,それぞれの違いが説明されていること

・出願前の先行技術調査では,全文を対象にスクリーニングを行う。

・出願前の先行技術調査では,当該発明と同一の内容が開示されている文献が1件でも見つかればそれ以上調査を続行する必要はない

⇒(コメント)まあその通りなのですが、実務的には「完全に同一の内容」が開示されるということは考えにくいですし、上述の観点は絶対的なものではなく、違う観点として検討するということも当然あり得ます。なので、実際的には、調査したほうが良いと思います。

・権利侵害調査では,特許権である特許請求の範囲を重点的に確認する。

⇒(コメント)まあ重点的にとあるから良いのかもしれませんが、将来的に請求項に上がる可能性があり得れば全て確認したいところです。分割等についての知識も必要ですし、データベースへの登録漏れ等のリスクも考慮したいところです。

・権利侵害調査では,権利侵害の危険がありそうな特許は漏れなく確認する必要があるので,回答集合は全てスクリーニングを行う。

 

このような論点を問うていたようです。あくまで試験的な発想で捉えなければいけない部分もありつつ、概ね妥当な論点かと思います。

 

4.最後に

 どうでしたかね。こんな良問が出るなら検索技術者検定を受けてみてもいいかもしれない(実は知りませんでした)。

 また、気が付いている方も多いと思いますが、プロフィールにイラストを追加しました。ココナラで頼んだのですが、非常に良く特徴を捉えていただいており、とても気に入っています。

 最後に告知です。ツイッターで話題になっていた「裏」法務系アドベントカレンダーという企画に参加させていただくことになりました。やっぱ法務の方は色々と勢いがあっていいなぁと思いつつ、せっかくだし面白いことをやろうと画策しています。それではまた。

特許・情報フェア2019 雑感

f:id:crysade:20191109101809j:plain


1.はじめに

 

 さて、今年もこの季節がやってきました。「特許・情報フェア」です。

 知財関係者と言えば、典型的には特許事務所で明細書を書いている弁理士や特許技術者をイメージする人が最も多いと思います。しかし、実は知財と言っても幅広く、特許庁で働く職員の方々や企業の知財部に所属している方も、もちろん知財関係者です。

 この特許・情報フェアは、主として特許の管理ツールや調査ツールを販売する企業等が出展するイベントであり、特許庁の関係者や企業の知財部のような特許の調査や管理を主とする業務を行っている知財関係者にとって、最も大きなイベントの一つです。

 私自身は、これらの業務をそれほど行っているわけではないのですが、前職の特許事務所が毎年ブースを出展していることもあり、毎年、参加させてもらっています。今年も、なんとか11月6日(初日)に会場に行って、一通り見て回ることができました。

2.全体について

 

 例年同様、大盛況でした、と言いたいところですが、昨年に比べると比較的会場内の移動がしやすかったように思います。気になって、来場者の比較をすると、初日に関して言えば昨年が6103人に対して、今年が5441人ということで若干少なかったようです(まぁ昨年は初日に参加したわけではないのですが)。

 そして、それ以上に明らかに感じるのが、出展者の減少です。特に海外からの出展者は明らかに

 

勢いがなくなったというとそういう訳でもないと思うのですが、、、、どうでしょう。

 その一方で目立ったのは、新規の出展企業の参入です。特にAI絡みの調査ツールを主力にした企業の参加が非常に増えていると感じました。まぁ正確に数えたわけではないので、あくまでも「印象」です。来年以降も、増えていく気はしますね。ただ、いずれのツールも調査目的のツールがほとんどで、明細書の自動作成に踏み込んだツールはあまりないですね。実用までのハードルは圧倒的に多いし、まぁ仕方がないのかな。

 そして、個人的に気になったのは、やはり「Shareresearch(日立)」のDerwent World Patents Index(DWPI,クラリベイト アナリティクス ジャパン)の閲覧サービスです。今となっては、私自身が「Shareresearch」使うのは費用的に難しいですが、使用した方は是非使用感を聞かせてください。

3.雑感

 

 今年は、実名でツイッターを始めたこともあり、例年以上に楽しむことができました。知財業界は、本当に狭い業界ですからこのようなイベント自体が同窓会のような心地よさがあります。まぁそれが業界としていいのかどうかは分かりませんが、、、

 いずれにせよ、会場でお会いできた方は勿論、お会いできなかった方も今後ともよろしくお願いいたします。そして、改めてこのイベントに興味を持った方は、是非来年は参加してみてください。法律や明細書の小難しい話はありませんから、比較的参加しやすいと思います。

 なお、イベントに参加したお陰かどうかは分かりませんが、前職のツテでAI絡みのセミナーをやることになりそうです。事務所の立ち上げ準備で追われているとはいえ、何だかんだで時間はありますからいいネタを仕込みたいですね。詳細が決まったら、どこかでお伝えします。

大学における特許収益の現状と山口大学の知財への取り組み

f:id:crysade:20191104113358j:plain


1.大学における特許収益

 

 知財業界に身を置いていれば、一度は聞かれたことがある質問があります。それは、結局のところ「特許(知財)は儲かるのか?」という問題です。まぁ以前の記事でも多少触れていますが、ビジネスにとって知財活動は必要です。では、特許が儲かるかと言われれば、「どうだろうなぁ」というのが正直な解答かと思います。

 一般の企業であれば、多くの場合、特許は事業防衛(市場における優位性を維持する)の目的で特許を取得するのですが、例えば、大学等においては、事情が若干異なります。大学等においては、自身が事業活動を行うことはありませんから、基本的にはライセンス等による収益が全てです。

 そのため、特許の収益性を議論する上で、大学等の収益状況というのは結構いい研究材料になります。文科省のプロジェクト等を担当していた時はかなり把握していたのですが、最近フォローできていなかったので、少し調べてみることにしました。

 

2.文科省のデータ

 

 実は、各大学の特許収入については、毎年文科省の調査の中で公表されています。

www.mext.go.jp

 中でも目を引くのが特許収入の伸びです。例えば、平成24年の特許料等収入額が約15.6億円なのに対して、平成29年が約42.9億円とされています。こちらの調査では、正確な「コスト」は分かりませんから、大学が特許でどれだけの利益を上げているのかは明確には分かりません。しかし、特許保有件数という観点で考えても、平成24年の特許保有件数の合計が約19800件に対して、平成29年でも約42000程度ですから、収入額の伸びに対してコストがそこまで大幅に増加しているとも考えにくいでしょう。

 近年の大学等における各種取り組みの成果なのは間違いないでしょう。正直、このデータは驚きました。実は平成25年に特許料等収入額が20億を超えたということは把握していたのですが、今はさらに倍ですからね。特許実務の肌感としても、大学や大学発ベンチャーの勢いを感じるのも頷けます。私が所属していた10年近く前の組織とは、今は、全く別の組織と言っても過言ではないのかもしれません。

 

3.山口大学の取り組み

 

 今回調べている中で特に目立った動きが紹介されていた山口大学の事例を紹介します。なお、私自身は山口大学の関係者と直接面識はありませんので、ご紹介する情報のソースはあくまでもネット情報です(笑)。

 

kenkyu.yamaguchi-u.ac.jp

 こちらが山口大学知的財産センターのHPのようです。ぱっと見、充実してますね。特に現場の研究者に対する教育活動や分かりやすい成果のアピールなど他の大学も見習うことが多そうですね。また、2017年12月の日刊工業新聞によれば、大幅な赤字であった山口大学は、特許出願により獲得できた外部資金(競争的資金等)を間接経費として計上し、結果として黒字であるという判断がされたようです。

 実際に、外部資金の調達にどれだけ貢献しているかはともかく、一定の貢献があるということに異論のある人は少ないでしょう。そのため、このような考え方は、他の大学は勿論、VC(ベンチャーキャピタル)から投資を受けるスタートアップ等においても、十分に妥当する手法でしょう。大学の知財については、そのうちもう少し深堀した内容の記事を書ければと思いますが、取り敢えず、本日はこのくらいで。

判決雑感(カプコンvsコーエーテクモ)

f:id:crysade:20191029180753j:plain


・事件名

 

平成30年(ネ)第10006号 特許権侵害行為差止等請求控訴事件・同年(ネ)第10022号 同附帯控訴事件

・事件の経緯

 

 原審である平成26年(ワ)第6163号 特許権侵害行為差止等請求事件に対する控訴事件になります。原審では、被告から原告に対する517万円の損害賠償請求のみ(請求は9億8323万1115円)が認められたことに対して、敗訴部分を不服として控訴がなされたものです。

 原告:株式会社カプコン(以下、「カプコン」と呼ぶ)

 被告:株式会社コーエーテクモゲームス(以下、「コーエーテクモ」と呼ぶ)

 

・判旨(主文)

 

1 控訴人の本件控訴に基づき,原判決を次のとおり変更する。

(1)被控訴人は,控訴人に対し,1億4384万3710円及びこれに対する平成26年7月11日から支払済みまで年5分の割合による金員を支払え。

(2)控訴人のその余の請求をいずれも棄却する。

2 被控訴人の附帯控訴を棄却する。

3 訴訟費用(控訴費用,附帯控訴費用を含む。)は,第1,2審を通じてこれを7分し,その1を被控訴人の負担とし,その余を控訴人の負担とする。

4 この判決の第1項⑴は,仮に執行することができる。

www.courts.go.jp

 

・主な論点

 

(1)本件発明Aに係る特許は特許無効審判により無効にされるべきものか

⇒特に公知発明においてセーブデータ(書き可能なディスク)をトリガとして採用しているところ、本件発明A(請求項1及び8)においては、「所定のキー(セーブ不可)」を採用することに対して阻害要因を認める点等を考慮して、進歩性を肯定しています。

*ただし、審決取消訴訟(平成29年(行ケ)第10097号)等において、既に争われている。

(2)控訴人の損害の有無及び損害額

⇒本件における実施料率を3.0%とし、弁護士等の費用を含めて合計1億2833万3710円(1億1667万3710円+1166万円)を損害額として認定しました。

(3)控訴人の損害の有無及び損害額

⇒本件における実施料率を1.5%とし、弁護士等の費用を含めて合計1551万円(1410万円+141万円)を損害額として認定しました。

・対象特許権1:特許第3350773号

 

 

【請求項1】ゲームプログラムおよび/またはデータを記憶するとともに所定のゲーム装置の作動中に入れ換え可能な記憶媒体(ただし,セーブデータを記憶可能な記憶媒体を除く。)を上記ゲーム装置に装填してゲームシステムを作動させる方法であって,

上記記憶媒体は,少なくとも,所定のゲームプログラムおよび/またはデータと,所定のキーとを包含する第1の記憶媒体と,所定の標準ゲームプログラムおよび/またはデータに加えて所定の拡張ゲームプログラムおよび/またはデータを包含する第2の記憶媒体とが準備されており,

上記拡張ゲームプログラムおよび/またはデータは,上記標準ゲームプログラムおよび/またはデータに加えて,ゲームキャラクタの増加および/またはゲームキャラクタのもつ機能の豊富化および/または場面の拡張および/または音響の豊富化を達成するためのゲームプログラムおよび/

またはデータであり,

上記第2の記憶媒体が上記ゲーム装置に装填されるとき,上記ゲーム装置が上記所定のキーを読み込んでいる場合には,上記標準ゲームプログラムおよび/またはデータと上記拡張ゲームプログラムおよび/またはデータの双方によってゲーム装置を作動させ,上記所定のキーを読み込んでいない場合には,上記標準ゲームプログラムおよび/またはデータのみによってゲーム装置を作動させることを特徴とする,ゲームシステム作動方法。

 

 

 概要:過去作品のセーブデータを有していると、本作品でも追加アイテム等が配布されるという「例のアレ」かと思ったのですが、訂正により「セーブデータを記録可能な記録媒体を除く」という文言が追加されました。この点、従前のゲームでは、前作のセーブデータの保有が前提であることとの差異が認められて特許性が肯定されました。かなり古い特許権(権利としては失効済み)ということもあるのですが、かなり微妙な判断です。

 

・対象特許権2:特許第3295771号。

 

【請求項1】遊戯者が操作する入力手段と,この入力手段からの信号に基づいてゲームの進行状態を決定あるいは制御するゲーム進行制御手段と,このゲーム進行制御手段からの信号に基づいて少なくとも遊戯者が上記入力手段を操作することにより変動するキャラクタを含む画像情報を出力する出力手段とを有するゲーム機を備えた遊戯装置であって,上記ゲーム進行制御手段からの信号に基づいて,ゲームの進行途中における遊戯者が操作している上記キャラクタの置かれている状況が特定の状況にあるか否かを判定する特定状況判定手段と,上記特定状況判定手段が特定の状況にあることを判定した時に,上記画像情報からは認識できない情報を,上記キャラクタの置かれている状況に応じて間欠的に生じる振動の間欠周期を異ならせるための体感振動情報信号として送出する振動情報制御手段と,上記振動情報制御手段からの体感振動情報信号に基づいて振動を生じさせる振動発生手段と,を備えたことを特徴とする,遊戯装置。

 

 概要:キャラクタのゲーム内の状況に応じて(コントローラ等を)振動させるという発明である。一般的に利用されている技術のようにも思えるが、プレイヤが画像情報からは識別できない情報を振動の違いによって伝達するという点は特徴的かと思います。

 

・雑感及び実務への影響

 

 昨年3月の審決取消訴訟(平成29年(行ケ)第10097号)を受けて、対象特許権1に関する判断が大きく変わったという判決のようです。実施料率も3.0%が採用されており、比較的高めの水準が採用されたように思います。

 なんだかんだ言ってもソフトウェア特許で、特許権者側に有益な判決は、少なく、今回の判決が確定するとすれば、比較的実効性の高い損害賠償額の判例ということになりますから、プロパテントの方向で実務への影響が比較的大きかも知れません。既に、9月24日付で最高裁判所に上告がなされているようですから、今後の動向も気になるところです。

 さて、ゲーム絡みで、面白い判決が出たのでご紹介してみました。一応、詳細が出たら検討しようと思っていたのですが、HPに詳細が上がるまでやたら時間がかかりましたね。好評なようであれば、たまに判例も扱うと思います。

 

*判例の紹介は普段あまりやりませんから、細かい間違い等あればご容赦ください。

 

innoventier.com

 

*今回の判決の記事は書かれていませんが、イノベンティアの藤田先生が関連する判決の解説をブログで書かれています。気になる方は、こちらも読まれると全体像が把握しやすいかと思います。

人間の意思決定とAIの結果はどのような影響を与えるか、可能性と限界

f:id:crysade:20191026105602j:plain


1.はじめに

 

 「分かりやすい文章」を意識しすぎて、文章がぬるくなってきた気がする・・・

 と言うことで久々に分かりやすさを無視した話をしたいと思います。キャッチーなタイトルにしますが、AIの推論結果をどのように利用するのかという話です。

 以前のブログでも記載していますが、私は別に機械学習分野の研究者という訳ではないのですが、AI・データ契約ガイドラインというガイドラインの策定に関わる機会がありました。このガイドライン自体は、あくまでも契約の話しだったのですが、せっかくの機会だしということで基本書を買いあさり、必死で勉強しました(一応、昔から統計や確率モデルはそれなりに)。

 とは言え、別に機械学習にそこまで詳しいわけでもないですし、あくまでも私見です(気楽に読んでいただければ)。

 

 さて、ここからが本題ですが、最近ツイッター等を見ていて気になることが二つあります。一つは、AIの推論結果の「精度」に対する認識。もう一つは、AutoML絡みの件もありデータサイエンティスト不要論のようなものです。

 いずれも、「推論」という行為の理解とその「目的の欠如」により起こるような気がしており、自分なりの考えをまとめておきます。将来的には、AIと法律の絡む論点に言及するためのネタになるとは思いますが、現時点ではまだまだ不十分ですね。

 

 まず大前提として、AIによる推論の結果というのは、人間の意思決定をサポートするために利用されるものです。したがって、本来的に求められるのは、事象に対する対する「精度(再現性)」ではなく、人間の「意思決定に寄与できる要素を必要十分に満たす」ということが必要です。

 ただし、一つ例外があります。n回の試行回数を前提とする場合です。例えば、保険会社の保険料の算出に利用される演算の中に統計的なパラメータの一環として機械学習の推論結果を利用するような場合は、単に精度が上がるかどうかだけの問題ですから精度は非常に重要です。このようなケースについては、今回の対象外とします(いずれどこかで)。

 

 これに対して、1回の試行回数の意思決定を行う場合はどうでしょうか。例えば、工場の異常を検知するようなシステムに機械学習の結果を利用する場合です。勿論、100%の精度であれば話は別なのですが、95%の精度を担保できるとすればそれは十分に高い精度を示す優秀なシステムのような気がします。

 しかし、異常を検知できなかった場合にリスクが極めて大きいという前提に立てばユーザにとって必要なのは、そのようなシステムではないはずです。

 例えば、異常がある可能性があれば100%に近い精度でそれを拾い上げ、異常がない場合に間違って呼び出される可能性はできる限り減らしたい(あったところで本来大きな問題はない)というのがニーズと理解すれば、全体的な精度は90%であっても異常がある可能性があればまずは知らせるというリスクヘッジを整えているシステムの方が有用な気もします。現実の社会では、確率や精度だけでは割り切れない事象が必ず存在します。今回の話のメインは、このような場合にどのように考えればいいのかという点です。

 

2.AIの推論結果の持つ意味

 

 もう少し別の事例で考えてみます。そもそも、AIの推論結果とはどのようなことを前提にして導かれるものなのでしょうか、現在の主流である教師あり学習において考えてみます。

 まず、教師あり学習においては、人の判断により学習に用いられるデータの解釈に対して「正解」が与えられることになります。いわゆるアノテーションと呼ばれる作業です。

 この「正解」という概念も実は結構厄介です。例えば、画像認識等の分野であれば、人が、これは「車の画像」、これは「人の画像」と言うような形で、所定の画像(若しくは画像の一部)に対して、正解を与えて行くことになります。

 つまり、この場合の正解とは、人が画像を視認した場合における人の判断と言うことになります。言い換えれば、あくまでも人の判断が基準であり、撮像された物が真に車なのか人なのかという点は問題にしていないということです。

 とは言え、人と画像の判別であれば比較的に個人差も少なく容易に行うことができますから、画像認識等の分野ではそれほど問題は生じません。

 

 では例えば、採用活動における人事担当者の判断を学習し、その結果を推論するようなケースはどうでしょうか。勿論、過去のデータとして採用・不採用の結論はありますから、データに対して「正解」を与えることは容易です。

 しかし、同じ(情報としてのパラメータを保有する)他の人物による面接の結果として、同様の結果になるでしょうか。もっと言えば、同じ人物が面接をした場合であっても、結果が変わるかもしれません。勿論、学習の結果、ある種汎用的な結果は出すことができますし、その結果にある程度の精度を求めることができると思います。

 しかし問題は、当日に当たった面接官、その年に一緒に面接を受けるライバル、面接を受ける企業の社内事情、といった特有の状況が結果に対して与える影響が非常に大きいということです。さらに言えば、面接を受ける人物にとって、採用の確率が60%なのか70%なのかという点が、実際に面接を受けるかどうかの意思決定に大きな影響を及ぼすのかというとかなり疑問があります。

 また、これはいずれのケースでも基本的には同様なのでが、AIの推論結果は、統計的機械学習を利用しているという前提において、確率的な指標として導き出されます。

 例えば、画像の結果は99%の確率で「人」とか、面接を受ける人は60%の確率で「採用」とかそのようなイメージです(不正確ですが、分かりやすさ優先で)。そして、断定した「結論」が欲しければ、閾値等も設けて結論を導くことができます。

 いずれにせよ、ここで言いたいことは、確率的な数値(指標)は、1回の試行回数の事象に対して有効な指標とはなりにくいということです。当たり前ですけどね。

3.本来必要なこと

 

 では、AIの推論結果を効果的に利用するために必要なことは何か。やはり、生じ得るバイアスを前提として意思決定に寄与する情報を合わせて提供することかと思います。

 具体的なイメージを持った方が良いと思うので、麻雀を例に少し説明します(AIというより単なる統計モデルですが)。自分がリーチを掛け、他の3人がそれを追いかけている状態を想像してみてください。

 もし、自分以外の3人が全て受け入れた牌をそのまま捨てたとすれば、自分が上がれる確率は単純計算(本当は当然もっと複雑)で約4倍です。しかし、自分以外の3人が全員安牌のみを捨てたとすると、基本的にはツモ以外では上がれません。

 このような状況において、意思決定者に対して、自分以外の3人は麻雀に精通している熟練者であるという情報が提供されたとします。麻雀に精通している熟練のうち手であれば、基本的に他家への振り込みはしないでしょうから、上がれる確率は低いかもしれません。

 ちなみに、もう少し精度を上げたいのであれば、他の3人の過去の振り込み率を考慮したり、その状況に応じた押し引き妥当性なんかを検討して、結果に考慮していくことで恐らく精度は上がります。

 

4.結論

 

 (特に試行回数が限られる状況において)AIの推論結果を含む統計的なデータをどのように考慮するかは意思決定者次第です。そして、そのために求められることは、単に精度の高い推論を実現するということではなく、意思決定者が行うための情報とリスクを過不足なく提示することこそ重要なはずです。

 さらに言えば、統計的機械学習のよる推論は、データの数を増やしていくことで、汎用的な精度の高さ(逆にここが本来的な強み)を実現することはできるものの、存在し得る多くの特殊事情に対しては有効に機能しない場合があります。

 特に1回の試行回数の意思決定を行う際には、その特殊事情のバイアスは無視できるものではなく結果を大きく左右するのが普通です。そのため、意思決定者は、その特有の事象を自身で判断して意思決定を行う以外の選択肢はなく、これは基本的に不可欠なプロセスです(最終的な責任を放棄することはそもそもできない)。

 という感じで「ガイドライン」の時点よりロジックを少し発展させました。どうでしょうね。結構気を使ってケアしているのですが、表現で気になる点があればご指摘ください。正直、まだまだまとまってないという自覚はありますが、もう少し思考が進めば法律論にも持って行けるかな、やる機会があるかどうかは別ですが。

 

 まぁいずれにせよ、機械学習然り、AutoML然り、社会実装フェイズに中間領域できる人材は大量に必要なわけで、データサイエンティストの市場価値は下がるどころか、まだ上がるんじゃないかなぁと思ってました。最後に、一応ガイドラインのリンクを張っておくので、興味がある方は是非。

 

www.meti.go.jp