En un arranque de sinceridad y generando un importante revuelo mediático, el CEO de Anthropic, Dario Amodei, nos advirtió hace unos días del impacto que tendría la inteligencia artificial en los empleos de oficina de nivel inicial. En una entrevista con Axios, el ejecutivo afirmó podrían volatilizarse hasta el 50% de este tipo de puestos durante los próximos 5 años. Lo cierto es que no se trata de un punto de vista fácil de refutar en estos momentos, pero en todo caso no podemos darle la espalda a la realidad. Podemos, como individuos y como organizaciones, luchar por adaptarnos o atrincherarnos en una realidad paralela. Mucha suerte a todos, en cualquier caso.

Lo que se explica en este artículo no es un caso de uso puntero o al alcance de pocos. Sí tiene unas ciertas barreras de acceso, pero lo cierto es que no son tan altas y hay que tener en cuenta que ejemplos como este, cada vez serán más comunes en todo tipo de industrias. Por lo tanto, el artículo está destinado a no envejecer especialmente bien.

¿Aún necesitamos bancos de imágenes?

Esa pregunta me ronda desde septiembre de 2022. Fue entonces cuando, después de asistir a una conferencia, pude probar algunas herramientas como DALL-E o Midjourney. La verdad es que fue la segunda la que más me gustó. Era y sigue siendo un modelo de inteligencia artificial generativa terriblemente potente con el que he tenido la suerte de trabajar bastante desde entonces. Suerte que nos dio la opción de salir del ecosistema de Discord hace ya casi un año.

Hasta hace no tanto, cada vez que necesitábamos imágenes con calidad profesional, teníamos que o bien pasar por caja comprando una licencia o bien tirar de soluciones más o menos creativas. El terreno de juego era un poco más complicado, pero como síntesis del caso podemos dejarlo así.

Los bancos de recursos gráficos son prácticos, pero tienen varias desventajas. Resultan caros para empresas pequeñas y medianas. Dependes siempre de estilos ajenos y eso es un límite de cara a mantener una identidad visual coherente. Añado que navegando por esos bancos también dedicas bastante tiempo y no aprendes nada. Se puede hacer mejor, la verdad.

Por qué construir un GPT especializado

Aprovechando el entorno de GPTs (Transformadores Generativos Preentrenados, por sus siglas en inglés) personalizados que ofrece ChatGPT, decidimos desarrollar a nivel interno de Smart Team un GPT que tiene como función principal dejar de ser clientes de cualquier tipo de banco de recursos gráficos y como función secundaria que la agencia pueda ser vendedora en Adobe Stock (lo seríamos también en Shutterstock si esta plataforma tuviese al respecto de la inteligencia artificial unas condiciones comprensibles).

La verdad es que crear un GPT no es difícil si te gusta la tecnología y tienes ganas de hacerlo. La interfaz que nos ofrece Chat GPT es muy intuitiva y si sabes lo que quieres, puedes obtenerlo en un plazo de tiempo bastante corto. Apunto algunas partes del proceso que seguimos:

  1. Aportar unas buenas instrucciones. Recuerda que estás hablando con un LLM y que estas instrucciones las generas en lenguaje natural. Eso significa lisa y llanamente que debes explicar que quieres que haga el GPT y como quieres que lo haga. Por lo tanto, vale la pena hacer un esfuerzo para explicarse de manera clara y precisa, pero nada más.
  2. Definir opciones para iniciar las conversaciones. En nuestro caso, la función principal es la de generar prompts para Midjourney a partir de una imagen, pero también hemos incorporado funciones de edición y etiquetaje además de un banco de pruebas para monitorizar la evolución del propio Chat GPT como generador de imágenes.
  3. Aportarle al modelo una base de conocimiento. Nosotros subimos las guías de estilo y los manuales técnicos de diversos bancos de datos, unos 50 artículos sobre la materia en cuestión, nuestro brandbook y todas las recomendaciones publicadas hasta aquel momento por Midjourney. Por lo tanto, al GPT le proporcionamos todo lo que necesitaba saber respecto a que imágenes tienen potencial de venta, como se define la calidad técnica de las imágenes y cómo funciona el modelo que usaremos para generarlas.

El proceso completo para crear un generador de imágenes con IA

Lo cierto es que, sin forzar mucho, en 60 minutos podemos generar más de 60 imágenes de buena calidad y tenerlas presentadas en Adobe Stock para su valoración y aprobación si es el caso. El siguiente paso sería medir resultados para 4 horas seguidas, pero de momento no hay tiempo para el experimento. Quizá en agosto. Aquí va el proceso:

  1. Diseño de una batería de prompts en nuestro GPT especializado.
  2. Generación, filtrado, upscalling y descarga en Midjourney
  3. Optimización de formatos y medidas con una herramienta en línea
  4. Generación de títulos y etiquetas en nuestro GPT especializado
  5. Carga en Adobe Stock, aplicación de títulos, aplicación de etiquetas y envío para revisión

En resumen, que, ya que te pones a dedicar una hora de tu jornada laboral a crear una galería de recursos gráficos para la página web de tu empresa, puedes aportar esos mismos recursos a una plataforma y esperar a que ese “activo digital” te acabe dando algún rendimiento. De como creemos que funciona el algoritmo de Adobe Stock podemos hablar otro día, pero lo cierto es que en el momento de redactar estas líneas hemos conseguido generar 4 descargas y nos tocará fantasear con que sucedería si nos pusiésemos a generar imágenes de recurso de manera compulsiva y seria. De momento, tenemos un rendimiento marginal pero se trata de un activo no limitado en el tiempo.

Resultados obtenidos

El impacto ha sido positivo y el proceso ha venido para quedarse y ser mejorado cuando proceda. Los principales resultados son los que siguen:

  1. Hemos dejado de depender de bancos externos. Creamos nuestros propios recursos gráficos y los adaptamos según las necesidades de cada proyecto y de cada momento.
  2. Hemos pasado de compradores a proveedores. Hemos puesto imágenes en circulación y hemos llegado a vender. Podemos intentar escalar esta actividad en algún momento y explorar su potencial, así como conocer sus límites.
  3. Controlamos la calidad y el estilo. No dependemos de la creatividad de terceras partes y no tenemos motivos para conformarnos con algo que no nos convenza.
  4. Creamos paquetes visuales para nuestros clientes. Podemos entregar y entregamos conjuntos de imágenes coherentes y adaptadas a la necesidad concreta. Por ejemplo, imágenes de calidad fotográfica para páginas web corporativas

No hace falta ser una gran empresa tecnológica para crear herramientas propias con inteligencia artificial y que tengan un impacto directo en tu negocio. Insisto en que aún hay barreras de entrada, pero llevar a cabo un proceso como el que se describe aquí no está tan lejos de lo que pueden hacer la mayoría de las empresas si se lo proponen. De entrada y en el momento de escribir estas líneas, creo que cualquier agencia de comunicación con un cierto volumen de facturación debería valorar la posibilidad de dejar de depender de bancos de recursos gráficos.

Business Development at   daniel@smart-team.io

Emprendedor y profesional con experiencia en sectores como las agencias digitales, la comunicación corporativa, la industria musical y las administraciones públicas. Especialista en organizaciones y desarrollo de negocio. Enfocado en la comprensión y el uso de las tecnologías digitales.