12月6日、OpenAIは「12 Days of OpenAI」の2日目として、新たな研究プログラム「Reinforcement Fine-Tuning(強化微調整)」を発表した。このプログラムは、特定の分野に特化したAIモデルをカスタマイズするための新技術を提供するもので、特に専門性の高いタスクにおける正確性向上を目指している。参加者には、アルファ版APIへのアクセスが許可され、この技術を用いたタスク実行とフィードバック提供が求められる。
この手法は、数十から数千の高品質なタスクを用いてAIモデルを調整し、提供された参照回答を基にその精度を評価するものだ。法律、医療、金融、エンジニアリングなど、正確性が求められる分野においては、専門家が認めるような成果がすでに報告されている。OpenAIは研究機関や企業を対象に、このプログラムへの参加を呼びかけており、将来的な技術公開に向けてフィードバックを収集している。
実用性と今後の展望
この技術は、モデルが類似の問題に対してどのように推論するかを強化し、より正確な回答を提供することを可能にする。結果が客観的に「正しい」とされるタスクに対して特に強みを発揮し、法律や保険業界では複雑な契約書の解析、医療分野では診断支援などの用途が想定されている。また、参加者が提供するフィードバックは、APIの改良と今後の公開版への反映に活用される予定だ。
「12 Days of OpenAI」の1日目には、「ChatGPT Pro」とその新モデル「o1」の発表が行われたが、この2日目の発表はそれと連動する形で、より専門的な領域への応用を重視している。OpenAIは、このプログラムを2025年初頭に一般公開する計画を進めており、AI技術がさらに幅広い分野で実用化される未来を見据えている。
【関連記事】
コメント