OpenAIが、農業・畜産から音楽作曲、民間航空操縦に至るまで、専門職ごとの業務課題データをフリーランスに作成させ、ChatGPTの学習に活用していることが分かった。
米Business Insiderが1日(米国時間)に報じた。データラベリングのスタートアップHandshake AIでは、この作業を「Project Stagecraft」と呼んでいるという。プロジェクトには約3000〜4000人のフリーランスが関わっているとされる。
Business Insiderが入手した作業指針によると、契約者は自らの業界経験をもとに「職務ペルソナ」を設定し、同僚に実務を依頼するような形でプロンプトを作成するよう求められている。ペルソナの文脈や目的、参考資料、成果物の内容を具体的に示すことに加え、作業工程はデジタル環境だけで完結できることが条件とされた。例としては、看護分野の専門家ペルソナを設定し、特定疾患に関する医学文献10ページ分をレビューした内容を成果物として提示するケースが挙げられた。
ガイドラインでは、「肉体労働ではなく知識労働」に重点を置く方針を示した。収集したデータは「経済的に関連性のある課題を整理し、モデルの能力を評価するために使う」と明記されていたという。また、「AIが必要とするはずだ」との想定で細かさを調整するのではなく、実際の業務フローや専門職に求められる水準をそのまま反映することも求めていた。
契約者の1人は、フリーランスの報酬が少なくとも時給50ドル(約7500円)だと説明した。Handshake AIのWebサイトに掲載された、OpenAIとの直接の関係が確認されていない求人情報では、専門家向け契約業務の報酬が時給最大500ドル(約7万5000円)に達する例も示されているという。
レビューは3段階で実施される。契約者が作成した成果物をHandshake AIが2回確認し、このうち1回は業界の専門家が職種ごとの詳細を点検する。その後、OpenAIが3回目のレビューを担うと伝えられた。
今回の取り組みは、ChatGPTの学習が汎用的な知識の蓄積にとどまらず、産業現場の業務手順や専門職の言語表現まで取り込む段階に入っていることを示している。農業・畜産、医療、航空といった細分化された領域の業務課題データを構造化して学習に用いることで、生成AIの活用範囲がさらに広がる可能性がある。