Servicios AINI


Ciudad de México, Diciembre 1.- En los últimos años, la Inteligencia Artificial (IA) ha pasado de ser una herramienta en los laboratorios de investigación a una fuerza que impacta en la sociedad, ya que prácticamente está al alcance de todos aquellos con acceso a internet.


Hoy la IA ya es capaz de generar textos coherentes, responder a preguntas complejas e incluso escribir código, lo cual sin duda ha suscitado admiración y, a la vez, una pregunta fundamental: ¿de dónde saca realmente su vastísimo conocimiento esta tecnología?


Y, aunque parezca magia, lo cierto es que la clave reside en realidad en el aprendizaje estadístico profundo sobre un acervo de datos tan inmenso que abarca gran parte del contenido digital producido por la humanidad.

¿Cómo aprende la IA? Así entrenan a los modelos


Para entender de dónde saca su información la IA, primero hay que entender cómo aprende. Se trata de un proceso complejo, pero que se puede resumir en tres fases:


Los modelos de IA, conocidos como Grandes Modelos de Lenguaje (LLMs), ingieren billones de tokens (piezas de texto) de diversas fuentes en un proceso llamado aprendizaje no supervisado. Este es el adiestramiento inicial donde la máquina se ‘empapa’ de la información bruta.


La predicción de la siguiente palabra


Durante este adiestramiento, el objetivo principal del modelo es extremadamente simple: predecir la siguiente palabra en una secuencia. Al ver miles de millones de frases, el modelo aprende las reglas de la gramática, la coherencia lógica y las relaciones semánticas. El conocimiento de la IA es, en esencia, una vasta red de probabilidades.


El refinamiento o ajuste fino

Una vez que el modelo ‘sabe leer y hablar’, se le aplica un ajuste fino (fine-tuning) con ejemplos de conversaciones de alta calidad para que pueda responder a peticiones, seguir instrucciones y comportarse de manera útil.

De acuerdo con Common Crawl, una organización sin fines de lucro que mantiene un archivo masivo y abierto de datos de rastreo de la web, el conocimiento de la IA se construye sobre tres pilares de información:

La web abierta: Esta es la fuente más extensa de datos. Incluye rastreadores masivos (como los de Common Crawl) que recolecta miles de millones de páginas web. Esta fuente proporciona la base de lenguaje natural y hechos, junto con contenido estructurado como Wikipedia.


Libros y literatura: Las colecciones de libros digitalizados permiten a los modelos alcanzar una coherencia lingüística superior y una comprensión de narrativas complejas.


Repositorios de código: Algunas plataformas como GitHub proporcionan el corpus de código fuente público que enseña a la IA la lógica computacional y la capacidad de programar.