AWS ayuda a acelerar la investigación científica con ayuda del aprendizaje automático
19 febrero 2021
La tecnología de Amazon Web Services está cotejando imágenes de cachalotes en una base de datos de miles de ellos, lo que acelera la investigación para identificarlos y comprender sus patrones migratorios.
AWS ayuda a acelerar la investigación científica de cachalotes con ayuda del aprendizaje automático

Cada semana, la bióloga marina Lisa Steiner realiza una videollamada desde su casa en la remota isla de Faial, en las Azores (Atlántico Norte), para hablar con un pequeño equipo de científicos y desarrolladores de datos. Quieren ver, como ella misma dice, si puede romper lo que han estado construyendo para ella. Ese "qué" es una herramienta digital, diseñada por un equipo de la consultora global Capgemini, que utiliza la tecnología del aprendizaje automático de Amazon Web Services (AWS) para ayudar a Steiner a identificar ejemplares de cachalotes con más rapidez y precisión.

Steiner rastrea los cachalotes, que pueden vivir hasta 70 años, fotografiando las aletas de las colas, o aleta caudal, y almacenando las imágenes en una base de datos. Al igual que las huellas dactilares humanas, cada ejemplar tiene una aleta caudal diferente. Al catalogar y cotejar las imágenes de la aleta caudal a lo largo del tiempo, Steiner puede identificar cuándo el mismo animal ha regresado a la zona.

Describir su investigación como un acto de amor sería un eufemismo. Cuando Steiner llegó al archipiélago de las Azores para empezar a estudiar los cachalotes en 1988, el muro de Berlín seguía en pie, Faith de George Michael era el álbum más vendido en Estados Unidos y pasarían cuatro años antes de que se enviara el primer mensaje de texto a un teléfono móvil. Tal vez no resulte sorprendente, especialmente para alguien que describe su propio nivel de interés por la tecnología "como probablemente de 1/10", que la investigación de Steiner sobre los patrones migratorios de las ballenas comenzara —y continuara— como una labor eminentemente manual.

"Salíamos en un velero desde las 9 de la mañana hasta las 10 de la noche —recuerda—. Fotografiaba las ballenas con un carrete en blanco y negro, pero no sabía hasta que la revelaba si realmente había captado una instantánea clara". Una cámara digital, por no hablar de un catamarán más rápido, exigen mucha menos paciencia a Steiner hoy en día. Sin embargo, la paciencia es una cualidad que parece tener a raudales, ya que la realidad diaria de su investigación se asemeja, al menos para una persona ajena a ella, a algo parecido al juego de concentración más largo del mundo. 

Aunque Steiner ha seguido a algunas ballenas durante tanto tiempo que ahora puede reconocer a alrededor de 100 ejemplares a simple vista, ni siquiera su vasto conocimiento y su infinito entusiasmo son suficientes para que la búsqueda de coincidencias en una base de datos cada vez mayor con más de 8.000 imágenes sea menos laboriosa. "Sí que tuve un programa informático", comenta Steiner, a diferencia de los comienzos, cuando se limitaba a colocar las fotos en el suelo. "Pero es de 2002, así que tiene casi 20 años, y es bastante engorroso. En torno a 2010-2011, empecé a retrasarme con las identificaciones".

El programa de Steiner la obligaba a cargar las imágenes e introducir manualmente en el sistema los datos que describían los contornos izquierdo y derecho de la aleta caudal de cada ballena. El programa era lento e incapaz de captar los pequeños cambios que se producían con el paso del tiempo, ya que no reconocía que, aunque el contorno de una cola hubiera cambiado ligeramente debido al desgaste, seguía siendo el mismo animal.

Hasta que un empleado del grupo de consultoría global Capgemini se unió a uno de los viajes de observación de ballenas de Steiner y vio el potencial del aprendizaje automático para ayudarla; de este modo nació la idea del Fluketracker. "Les facilité todas mis fotografías y han entrenado un algoritmo para saber cómo es la cola de un cachalote —explica Steiner—. Este ha conseguido encontrar coincidencias que yo era incapaz de detectar, sobre todo en colas con contornos muy suaves que son difíciles de distinguir entre sí".

El Fluketracker, que utiliza la tecnología de visión por ordenador y aprendizaje automático de AWS para clasificar y emparejar imágenes a gran velocidad, ya ha ayudado a Steiner a clasificar todas sus fotos de 2019-2020, identificando más de 200 ballenas nuevas.

"Ahora solo tengo que subir las imágenes, esperar unos minutos y si hay una ballena en el catálogo que ya está en línea, encontrará la coincidencia", afirma. "El objetivo final es realmente que la plataforma esté disponible al público y sea de código abierto, para que cualquiera pueda enviar fotos".

"Mi investigación solo abarca las Azores, así que sería fantástico recabar fotos de otras regiones", prosigue. "Cuanto más colaboremos, más información podremos obtener y mejor podremos entender a dónde van las ballenas y cómo se relacionan. Espero, de verdad, que estimule la imaginación de las personas". Esto es, por supuesto, si se las arregla para no romperla primero.