AI時代の泳ぎ方

AI時代のリスキリング論

tom's eye 185. データサイエンティストに求められるもの

2016年、モネの晩年の大作「睡蓮・柳の反映」がルーブル美術館の収蔵庫で見つかった。それは長く埋もれ、腐食が進行、大量の埃も堆積し、さらに上半分が消失していた。

それを復元するプロジェクトをNHKスペシャルで見た。

筆者は、特にAIで上半分をどう復元するのかに関心を持った。

 

AIによる自己学習をどう設計するか

データサイエンティストはどう動いたかと言うと、

最初はモネの生涯の絵の中から、「色使い」を300万箇所分析させ、そこからの知見を活用。

しかし、①暖色の色使いが多すぎる、②画筆のダイナミックな動きが感じられないと専門家からダメ出しを食らった。

そこで技術者は、この絵が書かれたモネの晩年の時期に絞って学習データを調整した。モネの色調は時代によって変わっており、晩年のものに絞った方がいいかもしれないという判断だった。

そしてもう一つ、モネに似た画風の画家にモネの「筆使い」の特徴を分析させ、パターン化し、それを基準に加えてAIに学習させた。絵のダイナミックさは「筆使い」からくるという仮説を持ったからだ。

この結果、最終的に専門家も納得する復元が実現した。

 

ここから何が学習できるか考えてみた。

 

①人間の脳が何を考えているか可視化する時、その考え方に捉われている時代にデータを絞って学習データにしていくという考え方は有効。つまり、あらゆるデータをぶちこんでも有効な結果が出ないことがあるということ

 

②データサイエンティストは、目的に対して最適な結果を得るのに、学習させるデータの基準を明確にすること。この場合は「色使い」と「筆使い」

 

③なので出来上がったものは、結局②のバイアスがかかっている。つまり本来の100%のものではない

 

④結局、データサイエンティストの見立て=個人の知恵こそ成果物の元にある。

 

この見立てができる人=人間の特性をよく洞察できている人が結果を左右するのであり、データサイエンティストとはその能力が高い人ということだ。

 ãã¢ãã®çµµãç¡è®ã¨ãã®åæ ãã®ç»åæ¤ç´¢çµæ