
“Tahap selanjutnya dari AI disebut AI fisik. AI fisik adalah saat AI berinteraksi dengan dunia fisik. Itu berarti robotika.” – Jensen Huang, Nvidia, pada upacara pembukaan pabrik di Taiwan bagian tengah pada 16 Januari 2025.
Tahun ini, CES berfokus pada integrasi AI ke dalam perangkat keras, mulai dari perangkat yang dapat dikenakan hingga furnitur yang diberdayakan AI hingga robot! Yang mencuri perhatian bukanlah robot mesin yang tidak menarik yang diadopsi oleh semua gudang—robot yang menyenangkan yang kita lihat dalam film fiksi ilmiah—tetapi robot yang menyerupai manusia.
Kita dapat mengatakan bahwa robotika sedang mengalami 'momen ChatGPT' (yang berarti teknologi ini bukanlah hal baru, tetapi minat masyarakat dan modal telah mengalami kebangkitan)
Khususnya, tahun lalu, kita melihat bagaimana Generative AI telah mengubah robotika secara drastis. Robot yang sebelumnya dikendalikan oleh remote kini dapat "berpikir" sendiri, mengintegrasikan AI ke dalam mesin dalam integrasi perangkat keras-perangkat lunak yang mulus. Kita melihat hari-hari awal dari dua bidang sains yang sangat berbeda bersatu: LLM/Gen AI dan robotika.
Minggu lalu, dilaporkan bahwa OpenAI diam-diam membuka kembali divisi robotiknya setelah menutupnya pada tahun 2020. Menurut perusahaan, tim robotika baru mereka akan fokus pada "membuka robotika serbaguna dan mendorong kecerdasan tingkat AGI dalam lingkungan dunia nyata yang dinamis."
[Saya akan menerbitkan ulasan mendalam tentang Unitree, perusahaan robotika humanoid dan berkaki empat terkemuka yang mengembangkan AI dalam tubuh dalam beberapa minggu, jadi nantikanlah.]
Yang saya rasa bermanfaat adalah menggunakan kerangka kerja ini saat mencoba memahami AI fisik, untuk melihat keseluruhannya sebagai proses berkelanjutan yang terdiri dari tiga langkah:
- Penginderaan (mata, telinga, dan tangan robot—teknologi sensorik),
- Berpikir (proses pengambilan keputusan—GenAI),
- dan Bertindak (kemampuan untuk menindaklanjuti dan memberikan dampak di dunia fisik—mekatronika).
Dalam cara yang lebih teknis untuk mengkategorikan ini, Diana Wolf Torres, seorang penulis AI, mengatakan arsitektur sistem dapat dipecah menjadi:
1) Lapisan Persepsi: Di sinilah mesin memproses masukan sensorik multimodal melalui algoritma fusi sensor yang canggih. Lapisan ini membantu komputer lebih memahami lingkungan fisik di sekitarnya.
2) Lapisan Kognitif: Ini adalah inti dari bagaimana AI terintegrasi ke dalam robot tradisional. Lapisan ini berfungsi sebagai otak pembuat keputusan mesin, yang memproses data yang dikumpulkan dari lapisan kesempurnaannya berdasarkan simulasi yang telah dilatih sebelumnya untuk memutuskan bagaimana bereaksi terhadap dunia fisik.
3) Lapisan Tindakan: Lapisan ini benar-benar menciptakan “output” ke dunia fisik, memastikan keakuratan dalam pergerakannya dan di mana kita akan melihat lompatan, langkah, atau objek bergerak.
Dan AI fisik mencakup banyak hal: 1) kendaraan otonom (yang sedang saya garap), 2) Robot Khusus – otomatisasi pergudangan/tenaga kerja (yang secara tradisional kita ketahui), dan 3) Robot Humanoid.

Penafian: Hari ini, kita hanya akan fokus pada robot humanoid. Saya berusaha sebaik mungkin untuk membuat pikiran saya logis saat menuliskannya dan mencoba memahami hubungan yang terus berkembang antara robot dan AI.
Robot Humanoid
Pertama, apa itu AI yang diwujudkan?
AI yang diwujudkan mengacu pada agen kecerdasan buatan (AI) — robot, asisten virtual, atau sistem cerdas lainnya — yang dapat berinteraksi dengan dan belajar dari lingkungan fisik.Definisi Qualcomm)
Selama bertahun-tahun, kita sudah terbiasa dengan lengan robot untuk penggunaan di gudang, robot pembuat kopi di seluruh Tokyo dan Shanghai, robot anjing untuk tujuan bersenang-senang dan pengiriman, dan perangkat semacam itu. Namun, robot-robot ini mulai kehilangan daya tariknya.
Sekitar sepuluh tahun yang lalu, seorang teman keluarga berinvestasi pada restoran robot di Beijing. Itu adalah mesin yang dapat memotong dan membuat sekitar 10 hidangan yang diprogram ke dalam mesin. Ibu saya menganggapnya sangat keren, tetapi robot itu tidak tampak seperti manusia, hanya mesin biasa, jadi hal baru itu tidak berhasil pada saya (saya cukup yakin mereka menutup toko itu setelah setahun). Hidangannya terasa enak, tetapi memasak bukanlah sains; Anda perlu merasakan api dan seberapa banyak garam yang harus ditambahkan. Terkadang, Anda perlu membuatnya lebih menarik dan berimprovisasi. Kasus penggunaan yang lebih cocok adalah untuk kafetaria universitas/kampus besar, pabrik, atau penjara tempat Anda perlu menyediakan makanan standar dalam skala besar secara efisien. Itu tidak berhasil sebagai restoran dengan harga menengah di CBD Beijing. Ada banyak pilihan lain yang lebih baik untuk makan di sana daripada makanan buatan robot yang rasanya biasa saja.
Sekarang, mari kita perkenalkan humanoid, robot yang secara fisik dirancang seperti manusia. Mereka memiliki dua lengan, dua kaki, dan kepala, dan mobilitas mereka meniru tubuh kita.
“Robot yang paling mudah diadaptasi di dunia adalah robot humanoid karena kita membangun dunia untuk kita,” kata Jensen Huang di Computex, seraya menambahkan: “Ada lebih banyak data untuk melatih robot-robot ini karena kita memiliki bentuk tubuh yang sama.”
Dan saya setuju dengannya. Obsesi kita dengan robot yang mirip manusia kini telah melampaui betapa egois dan mementingkan diri sendirinya kita sebagai manusia. Ini masalah penampilan tetapi juga masalah praktis. Jadi sekarang kedengarannya semakin mirip Aku, Robot.
Minat umum terhadap robot humanoid dimulai pada akhir tahun 2022 ketika Telsa meluncurkan Optimus. Sejak saat itu, banyak perusahaan robotika telah mendapat perhatian dari media dan investor di seluruh dunia. Ini menjadi bentuk robot “wow” yang baru.

Apa bedanya dengan robot tradisional?
Robotika tradisional telah ada selama lebih dari satu dekade. Robot konvensional ini mengandalkan pemrograman kaku untuk menjalankan instruksi yang telah ditulis sebelumnya (mengikuti serangkaian perintah dan tidak dapat "berpikir"). Robot tradisional pada dasarnya terbatas pada gerakan berulang yang telah diprogram sebelumnya dengan sedikit fleksibilitas, dan kompleksitas tugas yang dapat mereka tangani dibatasi. Sedangkan robot AI yang diwujudkan dilatih pada data dunia nyata yang menggunakan pembelajaran penguatan dan mereka telah mengembangkan kemampuan untuk "berpikir."
Pada bulan Oktober 2024, selama panggilan video di sebuah konferensi teknologi di Riyadh, Elon Musk meramalkan bahwa pada tahun 2040, akan ada setidaknya 10 miliar robot humanoid dengan harga antara $20.000 dan $25.000 melalui panggilan video di sebuah konferensi teknologi di Riyadh. Meskipun kita masih jauh dari itu, kita selangkah lebih dekat menuju robot yang menjadi lebih mudah diakses/umum dengan model robot terdepan dari Amerika, Tesla, Agility Robotics, Unitree, dan seterusnya.

Dalam Rapat Umum Tahunan (RUT) terbarunya, Musk, CEO Tesla, meramalkan bahwa jumlah humanoid akan melebihi jumlah manusia sebanyak dua banding satu atau lebih di masa mendatang. Itu gila (dan menakutkan).
Dan hari ini, David Soloman, CEO Goldman Sachs, mengatakan bahwa AI akan merevolusi produktivitas bisnisPandangannya adalah bahwa pada akhirnya, banyak dari apa yang dilakukan oleh para bankir junior akan digantikan oleh AI, seperti menyusun dokumen pengajuan IPO 95%, yang sekarang dapat diselesaikan oleh AI dalam hitungan menit, “5 persen terakhir sekarang penting karena sisanya sekarang menjadi komoditas.”
Para eksekutif melihat revolusi ini dan benar-benar berpikir bahwa robot AI akan menggantikan (membantu) kita suatu hari nanti.
Pengembangan dan Keterbatasan
Pidato utama Nvidia pada bulan Maret 2024 juga berfokus pada AI-robotika fisik. Kemajuan robot bergantung pada tiga faktor utama: 1) GenAI, 2) aktuator dan mekanik, dan 3) penyimpanan baterai (yang juga pernah saya singgung sebelumnya saat menulis tentang solusi energi terbarukan di sini)
Jika ketiga faktor tersebut dapat berkembang bersama, penskalaan massal dan komersialisasi robot humanoid kemungkinan akan terjadi dalam beberapa tahun. Sekarang, dalam artikel Unitree, saya berbicara tentang Tiongkok, mengingat pengalamannya yang panjang dalam pembuatan perangkat keras, yang telah memberinya keunggulan dalam hal pengetahuan dalam mekatronika, yang menggabungkan teknologi mekanik dan elektronik, mengingat Tiongkok telah menjadi pusat pembuatan perangkat keras untuk berbagai peralatan selama beberapa dekade terakhir. Sementara AS masih jelas memimpin dalam GenAI, pertanyaannya adalah faktor mana yang lebih penting, atau apakah akan ada niat untuk berkolaborasi? Dan siapa yang dapat menemukan solusi terakhir? Solusi baterai yang lebih baik. Dapatkah mereka membuat baterai lebih ringan, lebih tahan lama, dan lebih aman?

Kita manusia telah memimpikan dunia di mana robot berada di samping kita selama beberapa dekade, dari film Her pada tahun 2013, di mana kita membayangkan kekasih AI virtual (yang sekarang bisa menjadi kenyataan), hingga film thriller fiksi ilmiah tahun 2024 yang menampilkan Megan Fox Subservience di mana AI fisik menantang moral kita tentang kesetiaan, loyalitas, dan bahkan mengarah pada risiko keselamatan yang merugikan. Imajinasi selalu ada bahwa kita akan memiliki diri robotik yang diciptakan suatu hari nanti. Hanya saja sekarang, teknologi akhirnya cukup maju untuk mengejar imajinasi kita. (jelas, humanoid saat ini sama sekali tidak mirip Megan Fox)

Robot yang jatuh cinta pada manusia dan berubah menjadi jahat dalam film /Subservience/

Tokoh protagonis manusia yang jatuh cinta dengan agen suara AI dalam film /Her/
Jadi, menurut saya, ini jelas baru permulaan. Karena semua sumber daya sekarang digunakan untuk AI fisik (atau AI secara umum), bidang interdisipliner ini akan matang dari tahap awalnya dan terus berkembang lebih cepat daripada yang mungkin dapat kita pahami. Karena dunia fisik dan digital kita terus terbentuk dan menyatu, masalah keamanan benar-benar membuat saya khawatir sebagai ibu dari seorang anak berusia 2 tahun. Jika telepon pintar sudah membingungkan anak-anak tentang realitas, bagaimana kita harus mengatur teknologi ini, dan apa yang akan dapat dilakukan robot saat ia mencapai usia remaja?
Masih banyak yang harus dijelaskan, jadi saya akan menambahkan vertikal baru ke AI Proem: AI Fisik. Di vertikal ini, saya akan menjelajahi banyak area yang dapat memengaruhi pengembangan AI Fisik. Pertama, saya akan menyelami lebih dalam perusahaan robot humanoid terkemuka di Tiongkok, Unitree Robotics, yang sering dibandingkan dengan Boston Dynamics. Saya juga akan menjelajahi sudut pandang solusi baterai, yang selama ini saya coba cari waktu untuk menelitinya karya energi terbarukan saya.
Kemudian, saya pikir akan menarik untuk mengeksplorasi kekhawatiran seputar kemungkinan teori tentang bagaimana robot akan menjadi liar. Ini menyangkut keselamatan robot secara keseluruhan dan ketangkasan mesin robot. Kemudian, ada teknis konektivitas, bandwidth, komplikasi latensi, dan komponen utama lainnya—sensor (LIDAR), fusi sensor, dan teknologi arsitektur perangkat lunak. Ini juga terkait dengan bagian pekerjaan lain yang sedang berlangsung yang akan meneliti bagaimana perusahaan EV bertransisi menjadi perusahaan yang mengutamakan AI mengikuti jejak Tesla (misalnya, Li Auto).
Saya juga ingin memperluas liputan saya untuk menyertakan bagaimana AI akan memengaruhi alur kerja kita, jadi saya tengah menjajaki bagaimana tenaga kerja kita akan terdampak oleh adopsi AI fisik dan kemudian mungkin menyelidiki dan mendatangkan perangkat lunak AI atau bagaimana AI akan memengaruhi platform perangkat lunak era internet kita yang paling populer.
Ada banyak hal yang bisa dipelajari dan ditulis! Untuk saat ini, toodeloo~
Terima kasih sudah membaca Proyek AI! Berlangganan gratis untuk menerima postingan baru dan mendukung pekerjaan saya.
Berlangganan untuk Mendapatkan Pembaruan Posting Blog Terbaru
Tinggalkan Komentar Anda: