Ada alasan mengapa Google memajukan tanggal acara Made by Google ke bulan Agustus, meskipun perusahaan tersebut tidak pernah memberikan penjelasan resmi. Jelas bahwa Google ingin peluncuran Pixel 9 lebih awal untuk mencuri perhatian dari iPhone 16 mendatang.
Untuk melakukannya, Google mendemonstrasikan berbagai fitur AI Pixel 9, termasuk Add Me untuk memasukkan seseorang ke dalam foto setelah panggilan, hingga Call Notes untuk merekam dan meringkas panggilan telepon. Dan fitur Google Pixel Screenshots dapat membantu Anda menggali detail menggunakan kueri bahasa alami.
Semua ini didukung oleh chip Tensor G4 baru, yang secara khusus dirancang untuk menjalankan model AI Google yang paling canggih. Bahkan, ini adalah prosesor pertama yang dapat menjalankan Gemini Nano dengan multimodalitas, yang berarti Pixel 9, Pixel 9 Pro, Pixel 9 Pro XL, dan Pixel 9 Pro Fold semuanya dapat memahami teks, gambar, dan audio.
Untuk melihat lebih jauh senjata rahasia AI Google, saya berbicara dengan Jesse Seed, manajer produk grup untuk Google Silicon, dan Zach Gleicher, manajer produk untuk Google DeepMind, tentang apa yang dapat dilakukan chip Tensor G4 dan apa saja keunggulannya.
Tonton Terus
Apa yang membuat chip Tensor G4 menonjol di antara sekian banyak ponsel pintar?
Benih Jesse: Saya pikir inovasi terbesar yang kami buat tahun ini adalah menjadi silikon pertama dan ponsel pertama yang menjalankan Gemini Nano dengan multi-modalitas. Dan itu membuka beberapa kasus penggunaan yang sangat menarik, salah satunya adalah Pixel Screenshots. Itu sangat berguna jika Anda mencoba mengingat sesuatu.
Fitur lain yang tidak terkait dengan model Gemini Nano tetapi sangat saya sukai adalah fitur Add Me. Kami yang merupakan fotografer keluarga atau kru kami pasti akan senang karena dapat kembali menambahkan fotografer secara dinamis. Dan itu adalah sesuatu yang kami kerjakan dengan giat untuk menyempurnakan lebih dari 15 model pembelajaran mesin yang berbeda, dan juga menggunakan Google Augmented Reality SDK.
Bagaimana Anda memasukkan sesuatu secanggih Gemini Nano ke dalam ponsel?
Zach Gleicher: Di DeepMind, kami berkolaborasi dengan banyak tim di Google, dan kami ingin memastikan bahwa kami membangun model Gemini yang memenuhi kebutuhan semua produk Google. Jadi, saat kami mengembangkan Gemini bekerja sama dengan Android dan Pixel, kami menyadari bahwa ada kebutuhan untuk model di perangkat. Kami melihat ini sebagai tantangan karena di sisi server, semua orang mendorong model yang lebih canggih dan berpotensi lebih besar. Di sisi lain, kami memiliki semua kendala menarik yang sebelumnya tidak ada, seperti kendala memori, kendala konsumsi daya, dll.
Jadi, dengan bermitra dengan tim Tensor dan Pixel, kami dapat bersatu dan memahami apa saja kasus penggunaan inti untuk model pada perangkat ini, apa saja kendala untuk model pada perangkat ini, dan kami benar-benar mengembangkan model bersama-sama. Itu adalah pengalaman yang sangat menarik dan memungkinkan untuk membangun sesuatu yang sangat mampu dan mampu mendukung kasus penggunaan ini.
Bagi seseorang yang tidak pernah mengganti ponselnya dalam 3-4 tahun, apa yang akan menonjol bagi mereka dengan chip G4?
Benih: Jadi, meningkatkan apa yang kami sebut fundamental seperti daya dan performa sangat penting bagi kami. Tensor G4, yang merupakan chip generasi keempat kami, adalah yang paling efisien dan berkinerja terbaik. Jadi, kami yakin pengguna akan merasakannya dalam pengalaman sehari-hari seperti performa web atau penjelajahan web, serta peluncuran aplikasi dan kelincahan antarmuka pengguna secara keseluruhan. Saya rasa ini pengalaman yang sangat lancar. Anda akan merasakannya dengan performa web yang rata-rata 20% lebih cepat dan peluncuran aplikasi yang 17% lebih cepat.
Lalu bagaimana dengan performa bermain game, karena hal itu sangat penting saat ini bagi orang yang membeli ponsel baru?
Benih: Jadi dalam pengujian kami, kami benar-benar melihat peningkatan kinerja puncak dan berkelanjutan dalam permainan dan permainan umum yang berjalan di platform tersebut.
Bagaimana Tensor G4 membantu masa pakai baterai?
Benih: Kami meningkatkan efisiensi daya pada banyak kasus penggunaan sehari-hari. Jadi hal-hal seperti merekam video, mengambil foto, menggulir media sosial — semua itu menggunakan daya yang lebih sedikit dibandingkan generasi sebelumnya,
Itu semua berkontribusi pada daya tahan baterai ekstra 20% yang Anda lihat disebutkan dalam pidato utama. Jadi daya tahan baterai hampir 20% lebih baik, Tensor G4 berkontribusi dan mencapainya.
Apa saja fitur AI yang diaktifkan Gemini di ponsel Pixel 9 yang paling Anda sukai?
Gembala: Beberapa motivasi utama yang kami lihat mengapa tim Tensor dan tim Pixel datang kepada kami untuk kasus penggunaan di perangkat adalah keandalan yang lebih baik. Jadi, fakta bahwa Anda tidak perlu bergantung pada koneksi internet, pengalaman tersebut dapat diandalkan dan berfungsi di mana pun Anda berada.
Hal lain yang kami pikirkan adalah privasi. Jika pengembang tidak ingin data benar-benar keluar dari perangkat dan diproses sepenuhnya di perangkat, hal itu dapat dilakukan dengan menggunakan LLM di perangkat.
Dalam hal fitur AI yang saya sukai, tangkapan layar Pixel adalah salah satu yang sangat hebat. Saya pikir itu benar-benar menunjukkan bagaimana kita bisa mendapatkan fitur multi-moda yang berfungsi pada perangkat yang dapat berfungsi seperti yang dapat Anda lihat dalam demo. Itu benar-benar cepat, latensi rendah, tetapi juga merupakan model yang sangat mumpuni. Dan semua informasi dan data ini disimpan secara lokal di perangkat Anda dan dapat diproses secara lokal. Jadi kami benar-benar gembira bahwa Gemini nano dapat memungkinkan pengalaman seperti itu.
Saya pikir kita melihat daya tarik untuk kasus penggunaan ringkasan dan balasan cerdas.
Apa bedanya Pixel Screenshots dengan Windows Recall, yang sempat mendapat masalah karena masalah privasi?
Benih: Salah satu cara kami melindungi privasi pengguna adalah dengan memiliki model pada perangkat yang mumpuni. Jadi, analisis yang dilakukan pada tangkapan layar itu, tidak ada yang keluar dari perangkat. Jadi, itulah salah satu cara kami mengatasi masalah privasi itu.
Saya pikir hal lainnya adalah memberdayakan pengguna untuk memutuskan apa yang ingin mereka lakukan, seperti bagaimana mereka ingin menggunakan sesuatu seperti Gemini. Dan kasus penggunaan apa yang membuat mereka merasa nyaman untuk berinteraksi dan apa yang tidak. Jadi saya pikir itu benar-benar tergantung pada pilihan pengguna. Namun dalam kasus [of] Khususnya Pixel Screenshots, yang merupakan kasus penggunaan sepenuhnya pada perangkat.
Kami akan menjalankan semua tolok ukur biasa dengan Tensor G4, tetapi era AI juga mengubah banyak hal. Bagaimana menurut Anda tentang kinerja dengan chip ini?
Benih: Saya pikir semuanya kembali ke kasus penggunaan di dunia nyata. Seperti bagaimana benda ini benar-benar berfungsi di tangan? Jadi saya pikir hal-hal seperti seberapa cepat respons penelusuran web, seberapa cepat aplikasi diluncurkan, kecepatan dan responsivitas antarmuka pengguna, itu semua adalah kasus penggunaan sehari-hari. Itu adalah hal-hal standar yang bagus untuk diperhatikan.
Bagaimana dari sudut pandang AI? Kapan ponsel Pixel lulus uji Anda dalam hal performa?
Gembala: Saat kita memikirkan tolok ukur untuk LLM dan Gemini, dan khususnya saat kita memikirkan Gemini Nano, kita telah melihat industri menaruh fokus besar pada tolok ukur akademis. Dan tolok ukur akademis seperti MMLU sangat bagus, karena memberikan metrik umum. Namun, tolok ukur tersebut dapat dijadikan permainan dan orang-orang dapat mengoptimalkannya. Dan tolok ukur tersebut mungkin tidak menangkap apa yang benar-benar Anda pedulikan.
Untuk model pada perangkat, kami tidak terlalu peduli apakah model tersebut mengetahui pertanyaan riwayat. Kami pikir itu mungkin kasus penggunaan yang lebih baik untuk model sisi server. Yang kami pedulikan adalah kasus penggunaan seperti ringkasan.
Kami juga harus memikirkan kendala seperti konsumsi baterai. Kami harus memastikan model tersebut berkinerja baik dan tidak menghabiskan terlalu banyak baterai. Dan latensinya juga bagus. Jadi, kami bermitra dengan tim Tensor untuk membuat profil model kami saat kami merancang model ini bersama-sama untuk memastikan bahwa kami mendapatkan arsitektur yang berfungsi dengan baik.
Benih: Ini bukan hanya tentang metrik kinerja tradisional, tetapi juga kualitas. Jadi, jika Anda melihat hal-hal seperti kualitas respons yang keluar dari model, atau bahkan hal-hal seperti kualitas foto. Itulah yang lebih diperhatikan oleh pengguna di dunia nyata daripada angka di sisi kotak.