Inicio » Últimas Noticias » El auge de dos años de la IA: ¿ha resuelto la tecnología los desafíos de comercialización?
Ilustración de tecnología de IA con elementos digitales.

El auge de dos años de la IA: ¿ha resuelto la tecnología los desafíos de comercialización?

Desde la aparición de ChatGPT, el auge de la IA ha durado dos años. Durante este tiempo, el público en general ha estado entusiasmado con las capacidades de los grandes modelos de lenguaje, que pueden generar texto fluido y natural a partir de comandos simples, convirtiendo escenarios de ciencia ficción en realidad.

El campo de los grandes modelos también está entrando en una fase crítica, donde las nuevas tecnologías deben transformarse en nuevos productos que satisfagan necesidades reales y desarrollar un nuevo ecosistema comercial.

Así como los pagos móviles, los teléfonos inteligentes y LTE impulsaron colectivamente la prosperidad de la era de Internet móvil, la industria de la IA también está buscando un ajuste producto-mercado (PMF) en 2024.

Ha comenzado la era de la exploración de nuevas tecnologías, y el descubrimiento de una nueva frontera determinará si los modelos a gran escala son simplemente otro juego de quema de dinero, una repetición de la burbuja de Internet o, como dijo Jensen Huang, el comienzo de una nueva revolución industrial. Esta respuesta se revelará más rápido que la inteligencia artificial general (AGI).

Los grandes problemas de los modelos grandes

Hoy en día, la competencia en los modelos básicos se ha estabilizado básicamente. Liderada por OpenAI, con ChatGPT firmemente a la cabeza del mercado, otros actores como Anthropic, DeepMind, Llama y Grok tienen sus puntos fuertes.

Por lo tanto, lo más emocionante en 2024 no es quién haya ampliado los parámetros o mejorado la velocidad de respuesta, sino cómo la tecnología de modelos a gran escala puede convertirse en un producto utilizable.

Desde el principio, la aplicación de la tecnología de modelos de lenguaje de gran escala ha sido un desafío. Harvard Business Review realizó una encuesta y descubrió que existen hasta 100 tipos de aplicaciones de IA generativa.

Gráfico que clasifica las aplicaciones de IA en cinco tipos principales.

Sin embargo, se dividen en cinco categorías principales: resolución de problemas técnicos, producción y edición de contenidos, atención al cliente, aprendizaje y educación, y creación e investigación artística.

La conocida firma de inversión a16z ha compartido los principales productos de inteligencia artificial generativa de su equipo, incluidos nombres conocidos como Perplexity, Claude y ChatGPT. También hay productos más especializados como las aplicaciones para tomar notas Granola, Wispr Flow, Every Inc. y Cubby. En el sector educativo, el mayor ganador de 2024 fue NotebookLM, junto con chatbots como Character.ai y Replika.

Para los usuarios comunes, la mayoría de estos productos son gratuitos y las suscripciones o versiones profesionales no suponen un gasto necesario. Incluso para un actor fuerte como ChatGPT, los ingresos por suscripciones en 2024 fueron de unos 283 millones de dólares al mes, el doble que en 2023. Pero, frente a los enormes costes, estos ingresos parecen insignificantes.

Disfrutar de los avances tecnológicos es una alegría para el usuario común, pero para los profesionales del sector, por muy apasionante que sea la evolución tecnológica, no puede quedarse en el laboratorio; debe entrar en el mundo comercial para probarla. El modelo de suscripción no ha sido ampliamente aceptado y aún no ha llegado el momento de incorporar anuncios. El tiempo que les queda a los grandes modelos para quemar dinero se está agotando.

Por el contrario, el desarrollo orientado a los negocios es más prometedor.

Desde 2018, la mención de la IA en las presentaciones de resultados de las empresas Fortune 500 casi se ha duplicado. En todas las presentaciones de resultados, el 19.7 % de los registros menciona la IA generativa como el tema más discutido.

Este es también el consenso de toda la industria. Según el informe sobre el desarrollo de la inteligencia artificial (2024), publicado por la Academia China de Tecnología de la Información y las Comunicaciones, para 2026, más del 80 % de las empresas utilizarán API de IA generativa o implementarán aplicaciones generativas.

Las aplicaciones para empresas y consumidores muestran diferentes tendencias de desarrollo: las aplicaciones para consumidores enfatizan las barreras bajas y la creatividad, mientras que las aplicaciones para empresas se enfocan más en la personalización profesional y la retroalimentación de la eficiencia.

En otras palabras, mejorar la eficiencia es algo que todas las empresas buscan y quieren lograr, pero decir solo estas cuatro palabras es demasiado vago. Los modelos de gran tamaño deben demostrar que pueden resolver problemas reales en los casos de uso y mejorar verdaderamente la eficiencia.

Encontrar con precisión los puntos de entrada para implementar la tecnología

Ya sea en términos de inversión en recursos o de esfuerzos de expansión del mercado, la competencia de China en modelos de gran tamaño fue intensa durante 2024.

Según datos del Ministerio de Industria y Tecnología de la Información de China, la tasa de crecimiento del mercado de modelos de lenguaje a gran escala de China en 2023 superó el 100% y alcanzó aproximadamente los 2 millones de dólares. Las empresas están experimentando activamente con la comercialización, participando inicialmente en guerras de precios: reduciendo los costos mediante la facturación basada en tokens, llamadas a API y otros métodos. Muchos modelos a gran escala convencionales ahora son casi gratuitos.

Reducir los precios y los costos es relativamente fácil de lograr. Sin embargo, comprender el negocio y analizar los escenarios de entrada es un camino más desafiante.

No todas las empresas participan en guerras de precios, confiando en la competencia de bajos costos.

“En esta situación, es más importante encontrar nuestras características únicas y aprovechar nuestras fortalezas. Tencent tiene muchos escenarios internos que nos brindan más información y mejoran aún más nuestras capacidades”, dijo Zhao Xinyu, especialista en productos de inteligencia artificial en Tencent Cloud y director de productos ToB de Tencent Hunyuan. “Externamente, nos centramos en una industria, nos concentramos en escenarios específicos dentro de esa industria y luego nos expandimos gradualmente”.

Entre muchos modelos fundamentales, Hunyuan quizá no sea el más llamativo, pero su fortaleza técnica es innegable.

En septiembre de 2023, Hunyuan lanzó el modelo general de texto a texto Hunyuan Turbo, que adopta una nueva estructura de mezcla de expertos (MoE). Tuvo un buen desempeño en la comprensión y generación de lenguaje, el razonamiento lógico, el reconocimiento de intenciones, así como en las tareas de codificación, contexto largo y agregación. En la versión de actualización dinámica de noviembre de 2023, se actualizó al modelo de mejor desempeño en todos los ámbitos. Actualmente, las capacidades de Tencent Hunyuan se están entregando completamente a través de Tencent Cloud, que ofrece varios tamaños y tipos de modelos, combinados con otros productos y capacidades de IA de Tencent Cloud Intelligence, para ayudar a que las aplicaciones de modelos se implementen en escenarios.

Interfaz del modelo Hunyuan Turbo con detalles técnicos y métricas de rendimiento.

En la actualidad, las formas de aplicación de los modelos se dividen aproximadamente en dos tipos: escenarios serios y escenarios de entretenimiento. En este último caso se incluyen chatbots, aplicaciones complementarias, etc.

Los “escenarios serios” se refieren a aplicaciones en las operaciones comerciales centrales de las empresas, donde la precisión y la confiabilidad son muy demandadas. En estos escenarios, los modelos grandes necesitan manejar información estructurada, generalmente siguiendo procesos comerciales y estándares de calidad preestablecidos, y los efectos de su aplicación están directamente relacionados con la eficiencia operativa y los resultados comerciales de las empresas.

En una ocasión, Tencent Cloud ayudó a un proveedor de servicios salientes a crear un sistema de atención al cliente, lo que constituye un escenario serio y típico. Las llamadas salientes implican capacidades de diálogo en lenguaje natural, comprensión de contenido y capacidades de análisis, que son altamente compatibles con grandes modelos de lenguaje.

De hecho, el desafío está en los detalles. En ese momento, el equipo se enfrentó a dos desafíos principales. Uno era el de los problemas de rendimiento, ya que el tamaño de los parámetros del modelo era enorme, alcanzando una escala de 70B o 300B, y cómo completar la respuesta en 500 milisegundos y pasarla al sistema TTS posterior se convirtió en un desafío técnico importante.

El segundo problema era la precisión de la lógica del diálogo. En ocasiones, el modelo producía respuestas ilógicas en algunos diálogos, lo que afectaba el efecto general del diálogo. Para superar estos desafíos, el equipo del proyecto adoptó una estrategia de iteración intensiva, manteniendo un ritmo rápido de iteración de una versión por semana dentro de un ciclo de desarrollo de uno a dos meses.

Los clientes empresariales muestran interés en la tecnología de modelos de lenguaje a gran escala y están dispuestos a probar innovaciones, pero siempre existe una brecha cognitiva en la integración profunda de la tecnología y el negocio. Esto no se debe a una falta de comprensión de su propio negocio por parte de las empresas, sino que requiere un equipo técnico profesional para comprender en profundidad los puntos débiles de la industria y los escenarios comerciales, encontrar los escenarios más adecuados, adaptar las soluciones de aterrizaje de IA para las empresas y lograr la mejor combinación de tecnología y negocio.

“El enfoque tradicional podría requerir que los operadores construyan (corpus) un escenario a la vez”, explicó Xinyu, “pero con modelos grandes, solo es necesario dar una indicación para satisfacer la demanda”. Después de aclarar la demanda, el equipo de Hunyuan actualizó casi una versión cada semana, acelerando la velocidad de iteración y, en uno o dos meses, la precisión alcanzó el 95%.

Para este proveedor de servicios de salida, la tecnología generativa era algo completamente nuevo. Hunyuan les mostró directamente los beneficios que aportaban los modelos de gran tamaño, que reducían los gastos de mano de obra en tres cuartas partes.

"El mejor enfoque es mostrar los efectos", dijo Xinyu. Cuando los clientes tienen algún conocimiento de la tecnología generativa, pero no mucho, mostrar los efectos es lo más eficaz. Se trata de encontrar escenarios a los que se pueda acceder a través de la experiencia empresarial del cliente, realizar directamente la verificación de pruebas y demostrar las mejoras que se pueden lograr.

Una experiencia similar ocurrió en cooperación con Xiaomi, que fue descrita como un “viaje de ida y vuelta”.

La otra parte quería introducir modelos de gran tamaño en las interacciones de preguntas y respuestas, aplicando capacidades de búsqueda de IA a los terminales. Esto afectó dos de los puntos fuertes de Hunyuan: el respaldo que brinda el rico ecosistema de contenido de Tencent y las capacidades de Hunyuan en la búsqueda de IA. En el caso de las preguntas y respuestas, la precisión es muy importante.

“Al principio, todavía había muchas dificultades”, recuerda Xinyu. “Desde su perspectiva, el formato comercial abarcaba múltiples escenarios, incluidos chats informales, preguntas y respuestas de conocimientos y otros tipos, entre los cuales el escenario de preguntas y respuestas de conocimientos tenía requisitos de precisión relativamente altos”.

A través de pruebas preliminares, el equipo de Hunyuan aclaró sus ventajas en los escenarios de búsqueda y, junto con la otra parte, refinó gradualmente la interacción de preguntas y respuestas definida de manera amplia según los diferentes niveles de temas. Este tipo de segmentación permite que el modelo comprenda con mayor claridad las necesidades específicas y los requisitos de efectos de cada escenario, lo que permite realizar una optimización más específica.

El escenario de preguntas y respuestas sobre conocimientos se convirtió en el punto de aterrizaje. En las implementaciones posteriores, Hunyuan aún tenía muchos desafíos que superar: no es necesario mencionar los problemas de latencia, el tiempo de respuesta debe ser rápido; en segundo lugar, la integración del contenido de búsqueda.

“En todo el enlace, construimos un motor de búsqueda desarrollado por nosotros mismos y un modelo de clasificación de intenciones para determinar si se trata de una pregunta de alta actualidad. Por ejemplo, si está relacionada con noticias o temas de actualidad, y luego decidir si se la damos al modelo principal o a la búsqueda de IA”.

Llamar solo a las partes más necesarias mejora enormemente la velocidad de respuesta. Un descubrimiento importante es que el 70% de las consultas conducen a una búsqueda de IA, lo que significa que debe haber contenido lo suficientemente rico como para que la llamada de soporte sea la más básica. 

Detrás de Hunyuan se encuentra todo el ecosistema de contenido de Tencent. Desde noticias, música, finanzas e incluso atención médica, el ecosistema de Tencent ofrece una gran cantidad de contenido de alta calidad. El modelo de Hunyuan puede acceder a este contenido y consultarlo durante las búsquedas, lo que proporciona una ventaja única.

Después de más de dos meses de iteración intensiva, la calidad de las respuestas, la velocidad de respuesta y el rendimiento han cumplido plenamente los requisitos y se han implementado en las operaciones comerciales reales de Xiaomi.

La clave del negocio B2B es generar ingresos y ganar confianza, lo que requiere entregar valor real a las operaciones de los clientes.

Generalización de “rodar” para alcanzar más escenarios

La aplicación de modelos de gran tamaño en diversas industrias y productos también está fomentando el crecimiento de la propia tecnología.

En el caso de algunos productos de modelos grandes, la elección del camino B2C implica una consideración fundamental: utilizar la opinión de los consumidores para optimizar el modelo. La necesidad de ajustar los modelos grandes es infinita, y la cantidad y la actividad de los usuarios consumidores proporcionan el combustible para la iteración del modelo, acelerando así la velocidad de iteración.

De hecho, esto también se consigue en el negocio B2B, con exigencias aún mayores.

La función de calificación de ensayos de chino K12 de “Teenager Gains” utiliza las capacidades multimodales de Hunyuan. Combinada con la tecnología OCR inteligente de Tencent Cloud, reconoce el contenido de los ensayos de los estudiantes y utiliza el modelo grande para calificarlos según estándares de puntuación preestablecidos.

Por lo general, si la diferencia de puntuación entre el modelo grande y un profesor humano está dentro de los cinco puntos, se considera bueno, pero esto no es fácil de lograr. Inicialmente, solo el 80% de las puntuaciones de Hunyuan estaban dentro de los cinco puntos de las puntuaciones de los profesores humanos.

“El modelo tiene ciertos métodos y capacidades para resolver problemas en algunos escenarios. Sin embargo, cuando se centra en el negocio de un cliente específico, se requiere un mayor rendimiento”, dijo Xinyu. “Si bien una precisión del 90 % puede cumplir con los objetivos comerciales, con un 70 % u 80 %, aún existe una brecha”.

Esto significa que se necesita un esfuerzo continuo. A medida que la base de clientes empresariales se expande, se imponen nuevas exigencias a la tecnología en sí: en primer lugar, un aumento significativo en la velocidad de iteración (las iteraciones para usuarios particulares pueden tardar uno o dos meses, pero ahora puede aparecer una nueva versión semanalmente). Esta iteración de alta frecuencia promueve en gran medida el crecimiento y el progreso del modelo.

En segundo lugar, la capacidad de generalización del modelo ha mejorado significativamente al atender de forma continua a diferentes escenarios empresariales. Esto indica que atender en profundidad las diversas necesidades empresariales no solo acelera el ritmo de desarrollo e iteración del modelo, sino que también mejora su practicidad y adaptabilidad, lo que le permite expandirse desde escenarios serios a otros más orientados al entretenimiento.

La plataforma de contenido de juegos de rol “Dream Dimension”, que recientemente obtuvo decenas de millones en financiación de Serie A, ha aplicado el modelo exclusivo de juegos de rol de Hunyuan, Hunyuan-role, destinado a usuarios jóvenes. Combina tecnología de inteligencia artificial generativa para brindar una experiencia de interacción de personajes virtuales interactiva basada en una historia.

Hunyuan-role ha sido pionero en una nueva forma de interacción entre humanos y computadoras. Al crear diversas imágenes de personajes virtuales y basarse en historias y escenarios de personajes preestablecidos, involucra a los usuarios en diálogos interactivos naturales y fluidos.

En el nivel técnico, estas aplicaciones de escenarios han demostrado las ventajas principales de Hunyuan-role en el manejo de diálogos de texto largos y cortos, reconocimiento de intenciones y respuesta. Puede manejar diversos escenarios de aplicación y exhibe excelentes capacidades de humanización de contenido, no solo involucrando interacciones de diálogo cálidas sino también avanzando historias para crear una experiencia de usuario inmersiva.

Estas características convierten a Hunyuan-role en una herramienta poderosa para la adquisición de clientes de productos y las operaciones de los usuarios, y desempeña un papel crucial en la mejora de la retención y la participación de los usuarios. También refleja que Hunyuan, perfeccionada y mejorada en escenarios serios, ha desarrollado capacidades de generalización que pueden cubrir escenarios más amplios, incluso en aplicaciones del lado final.

Pasar de escenarios serios al entretenimiento, la creatividad y más es un viaje que las aplicaciones de modelos grandes deben emprender.

A medida que la tecnología madure y los costos disminuyan, los modelos de gran tamaño seguramente se expandirán a escenarios de aplicación más amplios. Inicialmente enfocados en escenarios comerciales serios como el trabajo de oficina corporativo, el análisis de datos y la investigación científica, estas áreas tienen demandas claras y una mayor disposición a pagar.

Una mayor expansión hacia el entretenimiento, la creatividad y la producción de contenidos requiere un ancla estratégica: centrarse siempre en resolver necesidades de escenarios específicos como objetivo principal, señalando el punto de entrada para integrar capacidades de modelos grandes.

Además de colaborar con el software de aplicación, también se necesitan asociaciones con fabricantes de hardware para permitir que el modelo funcione en el lado del consumidor, brindando servicios más cercanos a la vida diaria de los usuarios y ofreciendo experiencias de servicio más convenientes e inmediatas.

En este proceso, la conciencia y la aceptación del mercado de la tecnología de IA generativa aumentan continuamente, y la base de usuarios se expande de manera constante. Ante este entorno de mercado que cambia rápidamente, la capacidad de iteración del modelo se vuelve particularmente importante. Esto no solo se refleja en el rendimiento técnico, sino también en la comprensión de las necesidades de los usuarios, la adaptación a diferentes escenarios y más. Solo los modelos y equipos que pueden aprender rápidamente, optimizar continuamente y adaptarse constantemente a las nuevas demandas pueden mantener una ventaja en la competencia.

A medida que se cubren más escenarios, también se amplía el alcance a más consumidores finales. Con la aceptación general de la tecnología generativa en el mercado, la base de usuarios potenciales seguirá creciendo. Un modelo que pueda iterar y mejorar rápidamente puede adaptarse con agilidad a los cambios, avanzando de manera más constante y más lejos.

Fuente de ifanr

Descargo de responsabilidad: La información establecida anteriormente es proporcionada por ifanr.com, independientemente de Cooig.com. Cooig.com no representa ni garantiza la calidad y confiabilidad del vendedor y los productos. Cooig.com renuncia expresamente a cualquier responsabilidad por violaciones relacionadas con los derechos de autor del contenido.

Deja un comentario

Su dirección de correo electrónico no será publicada. Las areas obligatorias están marcadas como requeridas *

Ir al Inicio