ChatGPT, Claude o Gemini: ¿cuál es mejor para empezar a trabajar?

ChatGPT irrumpió hace más de tres primaveras y le cambió la forma de trabajar a todo el mundo. De a poco, cada vez tareas más sencillas fueron siendo cubiertas por esa inteligencia industrial en los rubros más diversos. Claro que la propia tecnología encontró sus límites con “alucinaciones” (invención de información), respuestas incompletas o modismos repetitivos que daban la pauta que un determinado material se había hecho con ChatGPT.
Frente a esto, algunos probaron otras tecnologías como Gemini (de Google). Recientemente empezó a popularizarse para uso corporativo Claude, de Antropic, cuyo uso es cada vez más extendido. ¿Pero cuál conviene usar en realidad para alguno que recién empieza?
“Los que estamos más o menos inmiscuidos en la IA sabemos que entre Claude, Gemini y ChatGP, el primero parece ser el claro líder, destaca Daniel Stilerman, especialista en Inteligencia Artificial y CEO de Nivii, una compañía dedicada al procesamiento de datos corporativos a través de IA.
Y agrega: “Actualmente le está yendo muy bien y los resultados son muy positivos”.
Según Stilerman, una buena metáfora para entender qué hizo a Claude tan bueno es pensar a los sistemas de IA -Chatgpt o Claude-, como autos de F1. “La pieza más importante de un auto de F1 es el motor, que en IA equivale al ´modelo´”, explica. Y agrega: “Luego está el resto del auto (suspensión, alerones, frenos, ruedas) que en el idioma de IA le decimos el ´arnes´ o el ´andamiaje´”.
Históricamente, la progreso de una traducción a otra de los sistemas de IA venía de motores más potentes. Le daban más datos, mejor preparados, entrenaban redes neuronales cada vez más grandes y luego le daban más y mejor feedback. “En Claude se dieron cuenta de que había mucho para ganar si mejoraban el auto, no sólo el motor; y el resultado fue impresionante, principalmente para las personas que hacen software”, subraya el hábil en IA. Y continúa: “Empezó a pasar que le pedías una tarea grande y el sistema se iba a trabajar quizás por hasta una hora y volvía con una solución que jamás se había visto”.
A pesar de esto, Stilerman advierte en hoy el postrer maniquí de ChatGPT tiene mejores resultados que el popular Claude 5 Fable, por lo que las tecnologías prácticamente se homologaron.
¿Cuál usar para empezar? “El que quieran. Claude parece ser el mejor, pero yo honestamente uso más ChatGPT porque lo encuentro más veloz y fácil”, sugiere el experto.
En la Argentina Chatgpt sigue siendo el líder del mercado, secundado por Gemini. Claude queda en tercer ocasión, por ahora.
¿Alucina menos Claude que ChatGpt?
La pregunta es ineludible: hoy es uno de los mayores limitantes de los usuarios a la hora de adoptar inteligencia industrial en temas importantes. El peligro a darle tareas complejas y que las resuelva mal.
Según Stilerman, Claude tiene un mecanismo que el adjudicatario siente más preciso: “En realidad no es que tenga mayor precisión, sino que es mucho mejor en lograr que se perciba eso”, señala.
En las llamadas pruebas de conocimiento (benchmarks de recall) los porcentajes de espejismo son de un sólo dígito y Claude normalmente está delante. “En benchmarks de conversación multi-turno más realistas como HalluHard, hasta el mejor modelo alucinó el 30% de las veces cuando le permitimos ir a buscar la respuesta exacta a la web, y más del 60% cuando no los dejamos”, indica.
Stilerman manifiesta que, a pesar de que no hubo grandes cambios, se siente que alucina menos. “Claude está calibrado para negarse o decir ´no sé´ antes que arriesgar, lo que baja las respuestas confiadas-incorrectas. GPT-5.5 tiende a dar una respuesta directa más seguido, lo cual es cómodo hasta que detectamos que contesta algo mal”, advierte.
Tres consejos para evitar que se acaben en la traducción paga
El otro problema para la prohijamiento de Claude es que la traducción gratuita se agota rápido. Y una vez que se paga, igualmente su uso está establecido: los “tokens” se agotan rápido y no funciona con un esquema “all inclusive” como ChatGpt. ¿Cómo optimizar esos tokens en Claude? Acá algunos consejos.
“El primero y principal es no usar el modelo más poderoso a menos que sea necesario”, recomienda Stilerman. “Por ejemplo, dentro de Claude si usamos Haiku los tokens van a durar cinco veces más que si usamos Opus y casi 10 veces más que si usamos Fable”, dice.
El segundo consejo es que cuando uno cambia de tema cree una nueva conversación. “Esto hace que no se use toda la conversación anterior cuando no era relevante, y además mejora la probabilidad de que te dé una buena respuesta por lo que vas a necesitar menos cantidad de mensajes”, sugiere Stilerman.
La tercera es un “hack” que puede dejar de funcionar alguno de estos días. “A veces hacemos una pregunta y la IA se inventa un plan que no tiene sentido, hace cualquier cosa y recién lo podemos corregir cuando vuelve a los 20 minutos habiendo consumido miles o millones de tokens”, señala Stilerman. “El truco para evitar esto es muy simple: pedirle que lo único que tiene que hacer es contarte cómo va a encarar la preparación de la respuesta. Eso te permite supervisar si lo está encarando bien y agarrar los errores mucho antes de que te gaste todos los tokens”, explica el hábil.





