Waymo ha indicado que utilizará Google Gemini AI para sus “robotaxis” autónomos. La empresa parece estar desarrollando un nuevo modelo de formación para sus vehículos autónomos, que extraerá datos de de google Modelo multimodal de lenguaje grande (MLLM) Gemini.
Waymo publica un nuevo artículo de investigación sobre los MLLM que ayudan a los robotaxis
Waymo LLC se conocía anteriormente como el Proyecto de vehículos autónomos de Google. Es una empresa estadounidense de tecnología de conducción autónoma. Waymo ha ido construyendo gradualmente hardware y software para robotaxis con el fin de transportar pasajeros de forma segura en carreteras muy transitadas.
Waymo publicó un nuevo trabajo de investigacióninformó El borde. Titulado “Modelo multimodal de extremo a extremo para conducción autónoma”o EMMA, el artículo de investigación se refiere a un nuevo MLLM dedicado a vehículos autónomos.
Este nuevo modelo de formación de un extremo a otro procesaría datos de sensores y generaría “trayectorias futuras para vehículos autónomos”. No hace falta decir que esto ayudaría a los vehículos sin conductor de Waymo a tomar decisiones inteligentes en la carretera. Los robotaxis Waymo podrían predecir con confianza dónde ir y cómo evitar obstáculos.
¿Cómo ayudará Google Gemini a Waymo?
Durante varios años, los algoritmos para vehículos sin conductor han adoptado soluciones o módulos compartimentados para abordar cada función crítica. En otras palabras, las empresas de tecnología intentaron abordar aspectos como la percepción, el mapeo, la predicción y la planificación, de forma independiente entre sí.
Tal enfoque tiene ayudó a resolver problemas para vehículos autónomos. Sin embargo, con este enfoque, las empresas han enfrentado problemas al ampliar sus soluciones. Esto se debe a «errores acumulados entre módulos y comunicación limitada entre módulos», mencionó Waymo en el artículo de investigación.
Además, los parámetros “predefinidos” hicieron que dichas soluciones fallaran a la hora de responder a “entornos novedosos” mientras luchaban por “adaptarse”. Gemini de Google es una Inteligencia Artificial Generativa (Generación de IA). Es una IA “generalista” que el gigante de las búsquedas ha entrenado con grandes conjuntos de datos extraídos de Internet.
En segundo lugar, las plataformas Gen AI han demostrado demostrar capacidades de razonamiento «superiores» a través de técnicas como el «razonamiento en cadena de pensamiento», sugirió Waymo. En pocas palabras, Géminis puede imitar el razonamiento humano y, por lo tanto, el LLM podría «pensar» como un conductor.
Aunque Google Géminis Si pudiera ayudar a Waymo, la IA de EMMA aún necesitaría funcionar bien con nuevos datos, algo que los vehículos autónomos deben hacer constantemente. Específicamente, EMMA ha enfrentado problemas al incorporar entradas de sensores 3D desde lidar o radar, admitió Waymo.
Fuente: Android Headlines