El uso de la Inteligencia Artificial no es un almuerzo gratis
ciatblog
En estos tiempos en que los titulares de los medios citan con frecuencia la Inteligencia Artificial, sus usos, potencialidades y peligros, en más de un foro nos preguntamos y nos respondemos sobre el uso que la administración tributaria puede dar a esas tecnologías para cumplir mejor su misión, tanto para facilitar el cumplimiento como para ejercer con eficacia el control. No nos referimos aquí la Inteligencia Artificial generativa, aquella de la que, como diría Sabina, hoy hablan los papeles, sino a la más «normalita», la que busca resolver problemas de clasificación y regresión, basada en cosas como aprendizaje de máquinas y redes neuronales. Esto es, para ilustrar, como la que en una librería de fotos puede encontrar aquellas fotos en las que aparecen gatos y descartar aquellas en que no aparecen aunque de vez en cuando falle y nos presente una liebre. En la administración hay un universo muy grande de situaciones que pueden ser clasificadas como «de interés»; contribuyentes olvidadizos, aquellos que se olvidan de declarar algunas cosas; contribuyentes actores, aquellos que simulan operaciones o hacen uso de documentos sobre operaciones simuladas; contribuyentes erráticos, aquellos que reportan cosas que en realidad son errores involuntarios (y de los otros); o en la mayoría de los casos, contribuyentes confiables, aquellos que quieren cumplir con sus obligaciones y a los que tenemos que ayudarles para que sus acciones de cumplir no sean muy costosas o sus tiempo de espera no sean grandes cuando requieren una devolución o un servicio. Claro que en estos casos, el fallar en la clasificación no es tan inocuo como identificar en una foto a un gato cuando en realidad, no era otro que un perro disfrazado. En el caso de la administración un error en la clasificación puede realmente resultar, como dice el dicho, que nos pasen un gato por liebre. Hay consecuencias para la administración y para los contribuyentes.
Muchas de las aplicaciones de analítica avanzada e Inteligencia Artificial se soportan en herramientas abiertas (Python, Scikit-Learn o TensorFlow); en entornos de colaboración abiertos en GitHub donde se pueden consultar, descargar o clonar proyectos; y en el libre acceso de fuentes abiertas de datos para entrenamiento de algoritmos, como los conjuntos de imágenes catalogadas como Digi-Face M1; a las plataformas para gestionar el trabajo de individuos que colaboran etiquetando los conjuntos de entrenamiento de datos, como Label Studio; a los propios algoritmos, que permiten, que una canción nueva se escuché en la voz de alguien distinto, y quede bien, como la música de Breezer en la voz de Gallagher. El Detector de Anomalías de Factura Electrónica es una herramienta abierta construida en el marco del Centro de Analítica Avanzada del CIAT con el apoyo de varios de nuestros países miembros, en cuyo proceso trabajamos estos dos servidores, y donde Microsoft puso el esfuerzo de ingeniería.
Pero, dice otro viejo dicho, que al que quiera celeste, que le cueste. A diferencia de lo que sucede con los algoritmos para clasificar gatos, los algoritmos para los procesos específicos de la administración tributaria no están todos disponibles para bajar de alguna nube. Se requieren inversiones y no solo hablamos de los costos involucrados en la dotación de la capacidad de cómputo en centros de datos propios o en la nube. Se requiere recursos humanos para su desarrollo, entrenamiento, prueba, validación y para su constante evolución y ajuste. Todo ello debe hacerse sin comprometer la satisfacción de la cada vez más exigente demanda de las aplicaciones tradicionales. Incluso las administraciones más grandes tienen dificultades para desarrollar todo internamente y si pudieran no deberían hacerlo: se necesitarán además de los especialistas en Inteligencia Artificial, científicos de datos, auditores, economistas o abogados y compartir inteligencia. Las administraciones más pequeñas lo tendrán más difícil todavía. Sin duda se requiere el apoyo externo y la contratación de servicios para estos desarrollos puede ser inevitable. Y entonces nos surge una duda, ¿cómo se contrata? ¿cómo se ejecuta? y ¿cómo se paga? ¿Es el problema igual al de la informática tradicional o es otro diferente?
Imaginemos que se trata de desarrollar un algoritmo que clasifique una situación como un incumplimiento o no. Podríamos pensar que quien distingue gatos u operaciones de tarjeta de crédito verdaderas de las falsas podría hacerlo. Por supuesto, que como administración tributaria no queremos compartir los datos con terceros (a diferencia de las fotos de gatos) y nos gustaría que quien desarrolle lo haga sin acceder a ninguno de los datos de la administración. El problema del investigador es hacerlo mejor que lanzando una moneda al aire o consultando a nuestros expertos. Si trabaja con datos sintéticos, inventados y totalmente distantes de la realidad, puede suceder que los algoritmos, por efectivos que sean con los datos sintéticos, podrían ser totalmente inútiles al aplicarse a situaciones reales y no de aquellas reservadas para la Isla de la Fantasía. Si anonimízanos los datos nos surge inmediatamente la duda sobre si los datos anonimizados son realmente anónimos o si un tercero podría, a partir de ellos identificar actores, o algunos de ellos.
Luego, viene el tema de la calidad, como en el de las pruebas del cáncer. ¿Debemos pedir para que nos sirva un 60% de aciertos o debemos exigir más? ¿A qué le llamamos acierto? Es lo mismo un algoritmo que tenga un 1% de falsos negativos (un operador fraudulento que solicita una devolución sea clasificado como confiable) que 1% de falsos positivos (un operador confiable que solicita una devolución sea clasificado como fraudulento). ¿Qué es más grave que le diagnostiquen a alguien cáncer con el precio de un susto o una operación innecesaria o que no lo detecten y se le deje ir sin tratamiento?¿Cuánto cuesta en recursos humanos y de máquina hacer cada prueba?
Pero incluso si se asegura la privacidad y si los algoritmos parecen buenos con los casos de prueba (pocos y de años pasados) siempre tenemos la duda de qué pasará en realidad porque puede suceder que la realidad haya cambiado. Los sistemas de Inteligencia Artificial hoy aprenden “jugando contra sí mismos”, por ejemplo, al ajedrez o al Go, pero las Inteligencias Artificiales tributarias aprenden de las inspecciones a los contribuyentes, a los que la Inspección les cuesta recursos e intranquilidad.
Un contribuyente tiene derecho a decidir si quien le contesta es una Inteligencia Artificial o una persona. Tiene derecho a saber el sistema que le asiste, por ejemplo, debe saber si la Inteligencia Artificial que le médica es especializada o si por ahorrar se está aplicando una de uso veterinario y debe tener el derecho saber si se le inspecciona porque existen motivos fundados bastantes o si lo es porque la Administración tiene a su Inteligencia Artificial en el “colegio de las Inteligencias Artificiales” aprendiendo y que le clasifican como a los gatos.
Las Inteligencias Artificiales que seleccionen contribuyentes no deben tener sesgos. Es bien conocido el caso de Países Bajos, donde su uso fue reprochado por el uso, no intencionado, de ciertas variables en la selección de contribuyentes, que condujo a que fueran, en proporción, seleccionados más de ciertos barrios y con ello de ciertas comunidades que de otras. ¿Cómo vamos a entrenar a nuestras Inteligencias Artificiales? ¿Con datos y criterios del pasado y que caiga quien caiga (estrategia que género el problema mencionado en Países Bajos) o con nuevos criterios? Si son nuevos los criterios ¿Quién paga el experimento? ¿Los contribuyentes que la máquina selecciona jugando contra si misma?
Resolver esto es difícil ¿Tienen recursos las administraciones tributarias para hacer en esta materia Investigación y Desarrollo, o es mejor esperar a que maduren?
De nuestra parte, conversando entre nosotros, pensamos que lo mejor que se puede hacer por ahora, es involucrar a los expertos de fuera de la administración como parte de equipos de desarrollo comandados por alguien la administración. Los recursos externos puedan ser sustituidos por otros cuando no «den la talla». Hay que asegurar que el conocimiento se quede en casa y que el uso de recursos humanos, financieros y de procesamiento sean razonables y significativamente menores que los beneficios que se obtengan de su aplicación.
Dicho en otras palabras, puestos a domar a la fiera de la Inteligencia Artificial para su uso tributario, lo mejor que se puede hacer es que las fieras sean de fuera (hay muchas y baratas) y el domador de dentro. Y que la fiera sea de nuestro tamaño.
Saludos y suerte.
4 total views, 4 views today
El uso de la Inteligencia Artificial no es un almuerzo gratis
Compartilo en Twitter
Compartilo en WhatsApp
Leer en https://www.ciat.org/ciatblog-el-uso-de-la-inteligencia-artificial-no-es-un-almuerzo-gratis/