テキストから画像を生成するAI「DALL-E2」や、チャットボットAI「ChatGPT」など、人工知能の研究グループ OpenAI が、テキストから3Dモデルを生成するAI「Point-E」をオープンソースにし、GitHubで公開、誰でもダウンロード可能にしました。
「Point-E」は、テキストを読み取り、3Dモデルデータを生成するAIで、数秒から数分でサンプルのモデルを生成できるのが特徴。
モデルを高速に生成する為に「Point-E」がとった手法は、まずテキストから画像を生成、次に生成された画像を用いて3D点群データを生成します。
本手法で生成された3Dデータは、品質という点ではまだ最先端には及ばないものの、最先端の他の手法に比べて、1~2桁速く、利用するケースによっては、実用的なトレードオフを提供できるとのこと。
|
「Hugging Face」で「Point-E」を体験
AIコミュニティ「Hugging Face」では、「Point-E」のデモを体験すことができます。
「Hugging Face」: https://huggingface.co/spaces/openai/point-e
アカウントを作成・登録する必要もなく、誰でもデモ体験できるみたいなので、早速試してみたいと思います。
まずは、固有名詞を入れたテキストから試してみましょう。
「a Yellow teddy bear(黄色いテディベア)」
んっ!? ナニコレ? 怖いんだけど。 これがテディベア? クマは? ぬいぐるみは何処に。なんか突起出てるし。
まあまあまあ、落ち着いて。最初ですから。
気を取り直して、今度は植物を生成してみたいと思います。
「a Purple roses(紫色のバラ)」
確かに植物っぽい。花の感じは出てるけど… バラの要素もう少し欲しいかな。
今度は人工物で挑戦
「a Red chair(赤い椅子)」
普通に椅子。あまりにも椅子。椅子でしか無い。椅子の形以外の何物でもない。
最後は昆虫で締めてもらいましょう。
「a stag beetle(クワガタ)」
最早カッコいいの域に到達した感じもする。
ということで、OpenAIが開発するテキストから3Dモデルを生成するAI「Point-E」がオープンソースになった話題でした。
デモを体験した感想としては、「今後の進展に期待しましょう」
因みに、この記事の最初に目に入るアイキャッチ画像は「a Pink Rabbit(ピンク色のうさぎ)」です。
記事作成で参考にしたHP[Cornell University / arxiv]: https://arxiv.org/abs/2212.08751
|
月額定額制の完全オンライン・プログラミングスクール
「SAMURAI TERAKOYA(侍テラコヤ)」
・月々定額のサブスクで利用でき、入会金も不要、いつでも退会可能
・現役エンジニアの講師とマンツーマン・レッスンで疑問や悩みを解決
・オンラインで学べるので地方在住者でも受講可能
|
|
BTOパソコンの草分け的ブランドFRONTIER(フロンティア) 3DCG/動画編集/ゲーム用途に合わせてCPUやGPUなどパーツを自由に選べてコスパにもこだわる方にオススメ。 |
|
|
|
|
|