
駄文怪文書の供養の回です。いろんな記事に触発されて考えたことを3月くらいから書き溜めてましたが色々ぶん投げて公開してい供養します。
10年後には家庭に普及? ヒューマノイドロボットの可能性とは - Impress Watch
日本ロボット工業会:講演「中国のヒューマノイド・ロボットの開発と利用の最新動向」 20250625 - Speaker Deck
このヒューマノイドブームは実を結ぶのか
ヒューマノイドの意義という話は古より散々語り尽くされている。人と同じ形であれば、人が生活する空間に入り込み、人と同じ道具をそのまま使って作業できる。日本でロボットを扱った人ならば一度は聞く言説だろう。しかし、それを体現するヒューマノイドは未だ登場していない。またそこにヒューマノイドを必要とするアプリケーションは存在せず単なる機能的特徴を述べているに過ぎない。 現在、主に米国、中国を中心としたスタートアップがヒューマノイドの開発を進めている。その内情はこういった動機なき技術の開発を生成AIへの投資から溢れた投機マネーによって支えているというのが実情ではないだろうか。 本稿では短期的な資金回収を意図した意味ではなく、出口が見えないまま関連する分野の余剰投資が割り当てられ、一種のバブルになっていることを表現する上であえて「投機」という言葉を利用する。 この投機による技術開発が新たな市場を作ることもあるだろう。だが、果たしてヒューマノイドにおいてそれは通用するのだろうか。本稿では今のヒューマノイドブームがなぜ成り立っているのか、これからどういう経路を辿るのかを考察してみる。
技術と投資のベストマッチが格安ヒューマノイドを実現した。
現在のヒューマノイドブームに登場したロボットに共通しているのはQDDモータによるAI利用を前提とした安価なロボットを実現していると言う点だろう。ビジネス的に投資を呼び込みやすい生成AIとQDDと言う奇跡的なタイミングでのランデブーがこのヒューマノイドブームを作り出している。しかし、本当に実用的なタスクに利用できるロボットが実現できるのはまだもっと先の話になるのではないだろうか。
Wow, incredible to pass $1M in orders since launch on July 1st!
— K-Scale Labs (@kscalelabs) 2025年7月3日
We launched K-Bot to give the world an open-source humanoid robot anyone can own.
Thank you to everyone who ordered!
The Humanoids revolution just got started 🚀🚀🚀 pic.twitter.com/iu7QL5x5fg
▼AIとロボットの融合を促進させるQDD
例えばUnitreeに代表されるような中国性のヒューマノイドはQDD(準ダイレクトドライブ)と呼ばれるモーターを採用している。ロボットと人や物の接触など、外力に対して柔軟に対応できる高いバックドライバビリティを備えている。また減速機が無いことで、摩擦やバックラッシュといった制御における邪魔な因子である機械的な損失を小さくすることができる。QDD自体は新しいものではないが、2019年ごとにMITが出したミニチーター以降、中国性の安価な製品が市場に出回ることになりロボットの価格を抑える結果となっている。 このQDDを使ったロボットはAIによる学習と非常に相性が良い。先にも言ったようにQDDモーターはバックドライバビリティが高い。これは模倣学習のデータを集めるにあたり、ロボット自体を直接教示しデータを集めることが容易になる。さらに重要なのは機械的な損失が少ないことで、理論通りに動くという利点がある。模倣学習では複数の機体のデータを集約して学習したAIモデルを利用して別機体(ここでは同一機種、別個体を指す)で再現性を持たせることができる。さらに、シミュレーション上での強化学習からのSim2Realが容易になる。理論としてAIに学習された動作を精度高く実機にて動作させることが可能になるため、シミュレーション上での理論上の学習結果をそのまま実機にて動作させやすくなる。強化学習を用いたヒューマノイドの歩行動作を学習させたデモンストレーションやUnitree Go2の歩行動作をシミュレーションで強化学習させて、実機で動作させることが比較的簡単に実現できているのはこのQDDモータの特性が一つの要因だと考えられる。
よりQDDモータについて知りたい方は以下参照
https://dspace.mit.edu/bitstream/handle/1721.1/118671/1057343368-MIT.pdf
しかし,2019年の MIT Mini Cheetah あたりを境に,かつて制御理論研究者がDD方式に求めたスペックを実現した安価な令和最新版DD/QDDアクチュエータが市場(アリエク)を跋扈するようになりました.
— まるた (@marurur) 2025年2月16日
(ちなみに,タイトル第2案は『令和最新版!ダイレクトドライブモータのすすめ』でしたが,シニア(略 pic.twitter.com/YR8LdDbuC5
▼物理世界のハードルを完全に越えられないAI
一方でAIによるロボット制御は未だ発展途上の段階にある。生成AIで成果を上げたTransformerや拡散モデル/Flow Matchingといったモデル構造が模倣学習やVLAにおいても成果を上げているのは事実だが、いまだ実験的な領域に過ぎない。 タスクの成功率や一連の動作の時間は短く、家事などのようなタスクの種類が多岐にわたり実行時間が長いロングホライゾンのタスクを学習させることは以前として難しい。 また未学習の環境や複数のロボットに対する対応も十分ではない。 いわゆるロボット基盤モデルという問題については大量データの収集とともに、基盤モデルそのものや理論の改善がこれからも必要になっていく。 先述の強化学習により歩き方を学習できたとしてもアプリケーションにあたる賢さを必要とするタスクを実行するにはまだAIは十分とは言い切れない。 いずれはこのようなAIの課題が克服され、ヒューマノイドに搭載され、様々な場所で使われる世界観が来るかもしれないが、現状を見る限りその世界とは大きな技術的な隔たりがまだ多く存在している。これが解決するのはおそらく明日でも1年後でもない、10年先はわからないかもしれないが、それも生成AI投資からこぼれ出た投機マネーが尽きればその進化のスピードは緩やかになるだろう。
ヒューマノイドロボットは本当に使えるのか?
現在中国、そして米国のスタートアップは開発したヒューマノイドを自動車工場や物流現場に導入する試験が始まっている。これらは本当に現実的なのだろうか? 例えば公開されたFigureのロボットは物流工場の中で一列に並び流れてくるパッケージの仕分け作業を行っている。同様に工場や物流工場でヒューマノイドが作業する姿は他のスタートアップからも公開されており、もはや珍しくもない。だがこれらの映像はあくまで投資家向けのデモンストレーションとして捉えておいた方が良い。
Our first customer use case took 12 months, our second customer use case took just 30 days
— Figure (@Figure_robot) 2025年2月26日
Helix learned high-rate logistics with a single neural network
On Sunday, we successfully validated this on-site at the customer pic.twitter.com/ev5OeSEhly
Watch Helix's neural network do 60 minutes of uninterrupted logistics work
— Figure (@Figure_robot) 2025年6月7日
Helix now incorporates touch and short-term memory and it's performance continuously improves over time pic.twitter.com/DvfBe9IdGH
実用を考えた場合にまずそもそもヒューマノイドである必要はなく双腕のアームを持った機会があれば良い。(なんならアームでなく別の解決策でも十分である可能性はある。) むしろヒューマノイドであるがゆえ、その稼働時間やメンテナンスなど「ロボットを運用するための人」や「予備のロボット」がどのくらい必要になるか想像を掻き立てる。 実際Unitree G1の場合連続歩行時間は2時間、H1は3時間とされている。上記のFigureと機種は違うが、いずれにしても実稼働時間は数時間というところではないだろうか。工場の中で安全に回収するためにはもう少し余裕を持たせるかもしれない。
ヒューマノイドに期待されるべきは人間と同じ環境で人間の代替として活躍する労働力ということになるのだろうが現状でもなおそれを期待できる能力にまだ達していないのではないだろうか。1箇所の配備に対して複数台の準備、または交換バッテリ、それを自動で賄う設備などを考えると少なくともコストは嵩むように感じる。
それでも成功するかもしれないという不安と期待
人間の代わりに休みなく何時間も働き、どんな作業でも指示するだけで軽々こなすという、我々が理想とする能力を持つ汎用的なヒューマノイドを実現するにはまだ技術的なギャップがあることを説明した。しかしそれでもなお、人はヒューマノイドに対して夢を見ずにはいられない。この流れのままヒューマノイドがマジョリティになる世界はどんなシナリオが考えられるだろうか。それはiPhoneのようにいち早く市場に製品を投入しアプリやプラットフォームとして地位を確立し、エコシステムを作り上げたシナリオに似ているかもしれない。
1. 安く使い勝手の良いロボットとしての地位確立
例えば4足歩行ロボットとしては後発でありながら確固たる地位を気づいたUnitree Go1/Go2は入手性の良さと、拡張性の高い移動ロボットの開発プラットフォームとして一定の支持をえているのではないだろうか。建設現場での利用など4足歩行というメリットは享受できるも必ずしも必須ではない環境に導入されるケースがいくつかある。 これと同じように、大量生産されて使い勝手の良いロボットがヒューマノイドになると言うのが一つの勝ち筋ではないかと考えている。ヒューマノイドである必要性はないけれどど、単純に双腕アームの使いやすいロボットとして買いやすく扱いやすいロボットがそれだったという話である。現状でも低価格を売りにしたヒューマノイドがでてきている。 また数が出ればその製品に対する投資が集まりより高性能な製品を安く大量に供給できるという好循環が発生する。
2. データ収集のためのプラットフォーム化
賢いロボットを作るためには大量のデータが必要となる。そのためにはロボットを大量にばら撒かなければならない。LeRobotはオープンハードウェアのロボットアームを担ぐことでこれを実現しようとしている。 1のように安く使い勝手の良いロボットとして地位が確立していれば同じロボットを使った学習データが集まり、さらにそのデータがユーザーを惹きつける好循環を生み出すことができるかもしれなし。つまり、みんなこのロボットを使ってデータを作っているから自分たちもそれを活用するために同じロボットを使うという理屈で採用するものだ。
3. 人間によるデータを扱いやすくする。
ロボットを学習させるためのデータを集めるのは難しい。最近ではロボットではなく、人間が作業をしている動画から直接ロボットに模倣させる研究もある。(昔からあるが今もある) 例えば現在ではYoutubeなどの動画プラットフォーム上で容易に人間による作業の動画を得ることができる。これを活用する際に、ヒューマノイドであればそのデータを転用しやすいと言うことになれば、これは「賢いロボットを作るためにヒューマノイドを活用する大きな動機になる」
まとめ
今のヒューマノイドロボットのブーム、そこに明確な需要や必然性はない。ハードウェアとAIの確認によってヒューマノイドは確実に安く性能が良いものができている。それでも実用には物足りない。生成AIからこぼれ落ちた投資が投機となり現在のブームに拍車をかけており、いずれ爆発的なヒットに繋がるかもしれない。一方で期待に足りずしぼんていく可能性も残されている。
国内でも昨今のヒューマノイドブームにあやかり再度本邦のヒューマノイド栄光の日々を取り戻そうとする動きがある。ヒューマノイドはAIに対する投資から生まれた投機である点を理解しつつ、しかしそれが当たるかもしれない技術のブレークスルーに注視し、決断は慎重にしかし素早く行っていく難しい舵取りが必要になっているのだろう。