Spain Brazil Russia France Germany China Korea Japan

Artificial Intelligence driven Marketing Communications

 
Sep 30, 2019 3:07 AM ET

Amazon crea una gran alianza para exigir compatibilidad con asistentes de voz


iCrowd Newswire - Sep 30, 2019

Foto por Dan Seifert / The Verge

Pero Google, Apple y Samsung no están a bordo

Un día antes de su evento anual de hardware de otoño, Amazon está haciendo un gran anuncio de asociación: ha creado la Iniciativa de Interoperabilidad de Voz, que es una especie de declaración de intenciones de más de 30 empresas diferentes que se esforzarán por garantizar que los dispositivos trabajar con múltiples asistentes digitales al mismo tiempo. Por ejemplo, puede shablar con Alexa o Cortana en el mismo altavoz inteligente simplemente diciendo la palabra de activación adecuada.

“Por mucho que a la gente le gustaría el titular de que va a haber un asistente de voz que los gobierna a todos, no estamos de acuerdo”, dice Dave Limp, SVP de dispositivos y servicios de Amazon. “Esto no es un evento deportivo. No va a haber un ganador”. Limp argumenta que si siempre habrá varios asistentes de voz, deberían trabajar mejor juntos.

Una amplia gama de empresas que crean software y hardware para asistentes de voz han firmado a la iniciativa. Sólo voy a citar el comunicado de prensa de Amazon directamente para darle algunas de las empresas en la lista porque está claro que Amazon va por un poco de choque y anos aquí, especialmente porque la lista incluye algunos jugadores importantes. He atrevido a algunos notables:

Más de 30 empresas están apoyando el esfuerzo, incluyendo marcas globales como Amazon, Baidu,BMW, Bose, Cerence, ecobee, Harman, Logitech, Microsoft, Salesforce, Sonos,Sound United, Sony Audio Group, Spotify y Tencent; operadores de telecomunicaciones como Free, Orange,SFR y Verizon; proveedores de soluciones de hardware como Amlogic, InnoMedia, Intel, MediaTek, NXP Semiconductors, Qualcomm Technologies, Inc., SGW Global y Tonly; e integradores de sistemas como CommScope, DiscVision, Libre, Linkplay, MyBox, Sagemcom, StreamUnlimited y Sugr.

Es una lista muy larga, y faltan tres empresas muy prominentes: Google, Apple y Samsung.

Foto por Dan Seifert / The Verge

Las empresas que están a bordo parecen bastante barajadas, si las cotizaciones que proporcionaron para el comunicado de prensa de Amazon son cualquier indicación. Intel dijo que sus chips de 10a generación funcionarán con “múltiples asistentes este año”, y Qualcomm dijo que sus chipsets son capaces de hacer múltiples palabras de activación ya.

Si lees entre las líneas de esta declaración de Andrew Shuman, CVP Cortana de Microsoft, encontrarás el guiño más suave posible a cómo Google y Apple han hecho que sus plataformas sean antipáticas para los asistentes de terceros: “Esperamos que la iniciativa nos ayude a ampliar esto visión de más empresas y fomentar un ecosistema equilibrado que capacite a las empresas para crear y poner a disposición sus asistentes, en todas las plataformas”. (Enfatiza el mío.)

Más intrigante, otras compañías parecen ansiosas por conseguir sus asistentes de voz en los dispositivos Echo. El CEO de Salesforce, Marc Benioff, escribe que “esperamos trabajar con Amazon y otros líderes de la industria para que Einstein Voice, el asistente de CRM líder en el mundo, sea accesible en cualquier dispositivo”. Mientras tanto, el oficial de I+D de Spotify es citado diciendo: “Estamos emocionados de unirse a la Iniciativa de Interoperabilidad de Voz, que dará a nuestros oyentes una experiencia más fluida a través de cualquier asistente de voz que elijan, incluyendo la capacidad de pedir Spotify directamente.” (Enfatiza el mío.)

La participación de Baidu también es notable. El asistente de voz DuerOS de la compañía china tiene más de 400 millones de usuarios, que es más que Alexa pero menos que Google Assistant. Baidu sólo rastrea Amazon como el segundo mayor fabricante de altavoces inteligentes, según la firma de investigación Canalys, habiendo superado a Google recientemente, a pesar de servir sólo al mercado chino.

La idea, estas empresas esperan, es que habrá dos tipos de asistentes. Un tipo será amplio en sus conocimientos y capacidades (piense en Alexa, Siri y Google), pero otros serán estrechos y profundos, específicos del contexto para su dominio de conocimiento. El objetivo es hacer posible hablar directamente con cualquiera de ellos en un altavoz inteligente sin la necesidad de una habilidad intermedia.

Es una estrategia que ya se está reproduciendo en los PC. El asistente de voz de Amazon está siendo más estrechamente integrado en Windows 10, lo que permite que los PC bloqueados respondan a las consultas generales cuando alguien grita “Alexa” desde el otro lado de la habitación. Cortana de Microsoft se está reorientando en las interacciones con el software y los servicios de la empresa.

Limp mide su visión de los asistentes de voz con los navegadores: puedes usar cualquier navegador que quieras ir a cualquier sitio web que quieras, así que ¿por qué no puedes usar cualquier altavoz que quieras hablar con cualquier asistente que quieras? “Somos una empresa web 1.0”, dice Limp, “y la razón por la que existe este edificio de que estoy sentado en este momento es una función de la interoperabilidad de la web”.

Es un ideal de mentalidad muy alta, pero también puede ser estratégicamente inteligente. Amazon ya tiene una posición fuerte en el hogar con Alexa, por lo que permitir que otros asistentes trabajen en sus altavoces Echo no parece un gran problema. Para ser claros, Amazon se compromete a permitir que eso suceda. La compañía ha anunciado previamente que los clientes de Orange en Francia podrán comprar altavoces Echo que admitan tanto a Alexa como al asistente de Orange Djingo.

Foto por Amelia Holowaty Krales / El Verge
Siri, y sólo Siri, funciona a nivel de sistema en el iPhone.

Sin embargo, Alexa no ha tenido tanto éxito en los teléfonos, a pesar de varios intentos de asociaciones con fabricantes de Android y fabricantes de auriculares. Una iniciativa en toda la industria en la que todos están involucrados excepto las tres empresas más influyentes en teléfonos inteligentes parece diseñada a medida para presionar a esas empresas. (También puede ayudar a Amazon a argumentar que no es monopolístico ya que está tan dispuesto a jugar bien con los demás y abrir su plataforma de voz a los competidores.)

Ya sea que lo veas como altruismo o ajedrez 4D estratégico, la iniciativa puede ejercer cierta presión sobre Google al menos. Ha sido más reticente permitir que Google Assistant funcione

con otro software, aunque quizás por razones relacionadas con la privacidad en lugar de la dinámica del mercado.

Cuando se le pregunta específicamente sobre Google, Apple y Samsung, Limp dice que “esas tres compañías, nos encantaría tener parte de esta iniciativa”. Eso hace que suene mucho como si hubieran declinado, pero Limp se negó a elaborar sobre eso.

Dice que aunque ha estado hablando con otras compañías sobre esta idea durante algún tiempo, sólo en las últimas “seis semanas” se fusionó en algo más formal. Saber lo rápido (o lentamente, según sea) empresas como Google y Samsung se mueven, seis semanas no parece mucho tiempo. Harman es técnicamente una subsidiaria de Samsung y los teléfonos Samsung ya ejecutan Bixby y Google Assistant simultáneamente, por lo que no está claro por qué no ha iniciado sesión. En cuanto a Apple, bueno, no es conocido por ser un unión.

Google nos dio una declaración, señalando que sólo se enteró de esta iniciativa durante el fin de semana:

Acabamos de escuchar acerca de esta iniciativa y tendríamos que revisar los detalles, pero en general siempre estamos interesados en participar en esfuerzos que tienen el amplio apoyo del ecosistema y mantener fuertes prácticas de privacidad y seguridad.

Nos estamos acercando a Samsung y Apple para comentarios.

Para ser claros, Limp no se encargará de creer que esta iniciativa ejercerá presión sobre esas empresas: “Si no quieren hacerlo, esto no va a cambiar de opinión”.

Foto por Chris Welch / The Verge

Desde una perspectiva técnica, hay mil preguntas sobre la implementación, el software, la privacidad y más de las que aún no tenemos respuestas. La Iniciativa de Interoperabilidad de Voz no pretende ser un organismo de normas, ni parece ser prescriptivo acerca de cómo sus miembros deben abordar los problemas complicados relacionados con la creación de un solo orador de apoyo a múltiples asistentes a la vez.

Amazon está regalando su “motor de palabras de despertar” de forma gratuita para que otras empresas que quieran crear sus propios asistentes puedan utilizar la investigación de Amazon para empezar. Pero las empresas del consorcio son libres de usar la tecnología que quieran.

Hasta la fecha, no ha habido muchos dispositivos que puedan “admitir varias palabras de activación simultáneas”. Portal de Facebook, algunos coches, y algunos teléfonos Android vienen a la mente. Los dispositivos más destacados, como el Sonos One, hacen que los usuarios elijan entre Alexa o Google Assistant por altavoz.

Pero no hay realmente una limitación técnica allí. Antoine Leblond, vicepresidente de software de Sonos, mandó a un orador de Sonos One que trabajó con las palabras de atención “Alexa” y “Hey Google” activas para mí a través de una videoconferencia ayer. Funcionó perfectamente bien, incluyendo la función de “continuidad” de Sonos que le permite iniciar música con un asistente y luego controlarla con el otro.

Traté de inmovilizar a Leblond en la razón por la que esto no es la forma en que funciona el Sonos One, como lo he hecho varias veces en los últimos dos años. Específicamente, ya que Amazon ha dicho repetidamente que está feliz de que Alexa coexista con cualquier otro asistente, ¿está Google no lo permite? Leblond murmuró, pero mencionó el hecho de que hay muchas cosas que podrían salir mal con dos asistentes activos en un solo altavoz. Por ejemplo: si estableces una alarma con un asistente y no estás cuando se apaga, ¿cómo sabrá tu familia qué asistente decirle que se calle?

Foto por Dan Seifert / The Verge

Averiguar cómo implementar múltiples asistentes desde una perspectiva técnica ni siquiera es el problema más difícil. Si hay algo que el año pasado nos ha enseñado, es que pocas personas se dieron cuenta de hasta qué punto los asistentes de voz estaban recopilando nuestros datos. Los escándalos rodantes han afectado a Amazon, Google y Apple por sus prácticas de hacer que los revisores humanos comprueben la calidad de las transcripciones. Los tres han cambiado de rumbo significativamente, aumentando la transparencia y facilitando la exclusión voluntaria, la eliminación de sus datos o ambos.

Un consorcio de 25 empresas que quiere facilitar la coexistencia de varios asistentes tampoco suena como una gran receta para la privacidad. Pero Limp enfatiza que quiere ser deliberado con la estructura de estos sistemas.

Por ejemplo, cree que debería haber reglas estrictas en las que a un asistente nunca se le permitiría “escuchar” una conversación con otro asistente. Eso parece simple, pero hay problemas más difíciles. ¿Debe la mayoría del trabajo involucrado en escuchar diferentes palabras de despertar ser manejado por hardware o software? Cuando Limp dice que imagina que “los asistentes de voz [podría] colaborar en la nube de una manera privada en nombre de los clientes de una manera que preserve el contexto y la continuidad”, ¿cómo se garantizará exactamente esa privacidad?

Y se vuelve aún más espinoso: un problema común en el último año ha sido la comprensión de que estos asistentes están grabando accidentalmente sin escuchar su palabra de vigilia. Así que en un mundo donde un orador podría tener dos o una docena de asistentes diferentes listos y esperando, ¿qué pasa con esas grabaciones accidentales?

Todavía no hay respuestas claras a estas preguntas, seis semanas después de que las discusiones sobre la formación de la iniciativa se pusieran serias, sólo el compromiso de determinarlas. Le pregunté a Sonos si hay reuniones o contratos o incluso cuotas, y las respuestas fueron no, noy y nope. Es todo muy temprano.

Amazon, especialmente con Alexa, tiene una reputación de moverse rápidamente para ampliar su ecosistema, a veces a expensas de la claridad o la calidad del software. Sólo piensa en los primeros días (y algunos más recientes) de usar habilidades con Alexa, que a menudo requieren comandos específicos y inclinados. Esta vez, al menos, Amazon no parece estar corriendo.

“Estamos cinco años después de esto”, dice Limp. Cuando mira los problemas técnicos y de privacidad aquí, cree que “es un problema manejable, pero no un problema trivial. Va a tomar muchos, muchos años para resolver.

Contact Information:

Dieter Bohn



Tags:    News, Spanish, United States, Wire