#1 コア・バリューと目標を理解する
何よりもまず、最終的なゴールと、AIプロジェクトで達成したい価値について自問してください。単に人工知能を使った基本的なソリューションを構築したいのか、それともビジネス目標に役立つ完全なAI主導型ツールを作りたいのか。そのようなテクノロジーに投資することで、御社はどのような利益を得たいのでしょうか?これは御社のビジネス目標にどのような影響や変化をもたらすのでしょうか?人工知能技術から得たい中核的な価値について、心に浮かぶすべての質問を自問し、さまざまな角度からAIイニシアチブを分析し、AIプロジェクトの最終的な目的を明確にしてみてください。経営陣や幹部が、自分たちがやろうとしていることの中核的価値と目的を基本的に理解すれば、次に何をすべきか、そのためにどれだけの投資をすべきか、より明確にイメージできるようになる。
![コア・バリューと目標を理解する]()
このステップは理論的に聞こえるだろう?しかし、AIプロジェクトに着手している企業の大半は、何を達成することを期待しているのか、プロジェクトがどこに向かうのか、まったくわかっておらず、結局は失敗に終わるか、無駄に時間とリソースを浪費している。彼らは単に、他の誰もがやっているから、あるいは自社のビジネスが最新の技術トレンドに対応しているかのように見せたいから、人工知能開発を追いかけているのだ。このドライバーはFOMO(乗り遅れの恐れ)として知られており、もう少し批判的なビジネス思考をすれば回避可能だ。したがって、AIプロジェクトの実現を望むのであれば、彼らの轍を踏んではならない。その代わりに、AIプロジェクトの目的を最初から明確にするようにしよう。ビジネスのペインポイントを特定し、それを解決するためにAIソリューションが生まれるはずです。さらに、設定する目標は現実的であるべきだ。もちろん、プロジェクトで高い夢を描くことは可能だが、最終的には、予想される結果がビジネスの文脈で実現可能でなければならない。プロジェクト計画を立てる前に、これらのことをすべてきちんと文書化しておく必要がある。
#2 正しい技術を見極める
![正しい技術を見極める]()
AI用のプログラミング言語、開発ツール、テストツールから、クラウドサービスやビッグデータ・ソリューションまで、AIプロジェクトに活用できる技術やソフトウェア・ソリューションは、市場に幅広く出回っている。例えば、コンピュータ・ビジョンのアプリケーションを構築しようと計画している場合、TensorFlow、Keras、Caffe、Torchなどを検討する必要があり、自然言語処理では、NLTK、spaCy、Gensimなどが一般的な選択肢となる。したがって、どの技術スタックが自分たちのプロジェクトに最も適しているかを決定するのは、企業にとって本当に圧倒されることだろう。
ここで重要なのは、まずプロジェクトの要件を理解し、それを適切なツールやテクノロジーとマッチさせることである。前回も強調したように、プロジェクトが何を達成しようとしているのか、どのようなデータが利用可能なのかを検討する。そうして初めて、選択肢を絞り込み、プロジェクトに適したリソースを選択することができる。
#3 適切な人材を見つける
ガートナー社が最近発表した2つのレポートによると、AIや機械学習プロジェクトのうち、成果に結びつかないプロジェクトの割合は85%を占め、プロトタイプから本番稼動に至るプロジェクトは53%に過ぎないことが明らかになった。残念ながら、AIプロジェクトの成否の鍵は、テクノロジーそのものよりも、人の要素にある。したがって、AIを使い始めるための次のステップは、AIプロジェクトを運営・管理する適切な人材を側に置くことである。あるいは、プロジェクトを最後までやり遂げるために必要なスキルと経験を備えたAI開発チームを作ることだ。
![適切な人材を見つける]()
ソフトウェア開発者の採用方法と同様に、チームに適した人材を厳選する前に、多くの要素を考慮する必要がある。実際にAIアプリケーションの開発経験があるか、少なくとも機械学習のコンセプトをよく理解している人を選びましょう。数学、統計学、アルゴリズムのバックグラウンドを持つデータサイエンティストやデータエンジニアを見つけることから始めるとよい。また、困難な課題に対して創造的な解決策を見出すことができるよう、批判的思考や問題解決に長けた人材を確保するようにしましょう。
まずは社内で、関連するスキルセットや経験を持つ社員がいるかどうかを確認し、そこから進めていくのが常套手段です。また、社内にAIプロジェクトに必要なリソースがない、あるいは十分でない場合は、専門の開発チームをアウトソーシングしたり、ITチームの増強サービスを利用したりするのも良い選択です。組織内でAI人材を育成したり、人材を確保したりするのは、非常に困難な作業だ。採用、トレーニング、管理のプロセスで苦労する代わりに、必要に応じて専門家に働いてもらうことができます。もちろん、長期的には時間とコストの節約にもなる。しかし、どのような道を選ぶにしても、適切な人材を味方につけることの重要性を忘れないようにしてください。
#4 データの最適化
データは、機械学習モデルを学習させ、アルゴリズムが予測を行う方法を学習するために使用されるため、あらゆるAIプロジェクトの中核となる。そのため、作業するのに十分な質の高いデータがなければ、機械学習モデルを訓練することも、データから価値ある洞察を得ることもできない。言い換えれば、データを最大限に活用するためには、データがクリーンで、ラベル付けされており、正確であることを確認するために、データを吟味する必要がある。したがって、機械学習モデルにデータを投入する前に、データを準備し最適化することが重要である。
![データの最適化]()
AI Creation Hierarchy Of Needsによると、データは通常、人工知能やディープラーニングの開発に至るまでに主に5つの段階を経る:収集、移動/保存、探索/変換、集約/ラベル付け、学習/最適化だ。しかし、私たちは単純に、上記のすべての段階をカバーするデータの準備と最適化という2つの主要な段階にまとめることができる:
- 機械学習モデルの学習に使えるように、データをきれいに整理するのに役立つ。データ準備には、データ置換、データ正規化、データ標準化など、さまざまな手法があります。データインピュテーションは欠損値をもっともらしい値に置き換えるために使用され、データ正規化は値が特定の範囲に収まるようにスケールを変更するために使用される。一方、データの標準化は、平均がゼロで分散が単位になるように値を変換するために使用されます。
- 第二段階では、データの最適化を行い、扱うべきデータ量を削減する。データ最適化のテクニックには、特徴選択と次元削減がある。特徴選択(変数選択)はデータセットから最も関連性の高い特徴を選択するために使用され、次元削減はデータセット内の特徴の数を減らすために使用されます。これらのテクニックは、機械学習アルゴリズムの効率を向上させるのに役立つため、重要な役割を果たす。
データを最適化し、準備が整えば、高品質な機械学習モデルの開発に一歩近づくことができる。次はどうする?
#5 永続的な基盤を築く
どんな高層ビルでも、しっかりとした基礎がなければ高くそびえ立つことはない。人材とデータという最も基本的な2つのものが整った今こそ、袖をまくってAIに取り組み、その基盤を構築する時なのだ。通常、AI主導のテクノロジーに関わるプロジェクトは、私たちが考えている以上に長期にわたるベンチャー事業になる可能性があるため、AIの力を求める企業は、長期にわたって拡張可能で長続きするものとしてAIに取り組む必要がある。どのような基本的なアプリケーションとも異なり、完成させて起動させれば終わりである。
![永続的な基盤を築く]()
教師あり学習であろうと教師なし学習であろうと、新しいデータが入ってくれば継続的に最適化できるシステムが常に必要とされる。つまり、AIモデルは継続的に育成される必要があるのだ。AIモデルは継続的に育成される必要があるため、人工知能の開発は並大抵のことではない。そうでなければ、すぐに時代遅れになって使えなくなってしまう。データ・サイエンティストは、常にML実験を行い、モデルを再トレーニングして、優れた予測を行うだけでなく、データの変化や進化に合わせて、時間をかけてモデルを改良していかなければならない。
- AIイニシアチブを実施・管理するための重要な組織体制であるAIセンター・オブ・エクセレンス(CoE)を設立することだ。AI CoEは、新しいアイデアを試し、プロセスやベストプラクティスを定義し、再利用可能な資産を開発するための基盤となる。また、AI CoEは、組織にとっての唯一の真実の情報源として機能し、全員が同じ見解を持つことを保証するのに役立ちます。一元化されたAI CoEを持つことで、努力の重複を避け、透明性を高め、組織全体のコラボレーションを改善することができる。AI CoEは、ビジネス・チーム、データ・チーム、エンジニアリング・チームの3つの主要チームで構成されるべきである。ビジネスチームはAIの機会とユースケースの特定を担当し、データチームはデータの準備と最適化を担当し、エンジニアリングチームは機械学習モデルの構築と展開を担当する。プロジェクトを円滑に進め、成果を確保するためには、これら3つのチームが緊密に連携する必要がある。
- AI CoEの設立とは別に、組織のプロセスとベストプラクティスを定義する必要がある。これには、機械学習モデルの開発、展開、運用方法に関するガイドラインの作成も含まれる。最初にワークフローを合理化することで、AIプロジェクトが長期的に拡張可能で持続可能であることを確実にすることができる。
- 最後になるが、再利用可能な資産の開発にも注力すべきだ。これらの資産は、組織全体の異なるチームで使用することができ、コストとリソースの節約と活用において有益である。再利用可能な資産の例としては、データパイプライン、機械学習ライブラリ、モデルテンプレートなどがある。