12. Un caso real

3 jul 20235 Min. de lectura

Trabajé en Recommind, donde ocupé el cargo de vicepresidente de producto desde 2014 hasta 2016. Recommind es una empresa especializada en software y soluciones de descubrimiento electrónico (e-discovery, en inglés). El descubrimiento electrónico se refiere al proceso de recopilación, organización y análisis de grandes volúmenes de documentos electrónicos relevantes para un caso legal. En el año 2016, OpenText adquirió Recommind. La adquisición permitió a OpenText fortalecer su oferta en el ámbito del descubrimiento electrónico y ampliar su presencia en el mercado. El descubrimiento electrónico es particularmente relevante en los Estados Unidos, donde se llevan a cabo numerosas demandas legales. Los jueces exigen que se presenten todos los documentos relacionados con un caso, ya sea una demanda por infracción de propiedad intelectual o una acusación de acoso sexual. Esto implica recopilar y revisar grandes volúmenes de información en formato electrónico. Recommind se destacó por ser pionera en el uso de las Máquinas de Support Vector Machine, SVM) para el descubrimiento electrónico. SVM es un algoritmo de aprendizaje automático que permite clasificar y analizar documentos de manera eficiente. Este enfoque posibilita identificar documentos relevantes y descartar aquellos que no tienen relevancia para un caso, lo cual ahorra tiempo y recursos significativos. La utilización de SVM en el descubrimiento electrónico resulta más eficiente en comparación con el pago de abogados para que revisen documentos de forma manual. Los algoritmos de SVM pueden analizar grandes volúmenes de datos de manera precisa y rápida, lo que reduce los costos y el tiempo dedicado a la revisión manual. Además, SVM puede aprender y mejorar su rendimiento con el tiempo, lo que aumenta su eficiencia. En general, el descubrimiento electrónico ha sido un excelente ejemplo temprano de inteligencia artificial en los negocios. La implementación de algoritmos de aprendizaje automático, como SVM, ha permitido automatizar y agilizar el proceso de revisión de documentos legales, mejorando la eficiencia y reduciendo los costos. Esto demuestra cómo la inteligencia artificial puede tener un impacto significativo en la industria legal y en otros sectores empresariales al ofrecer soluciones más rápidas y efectivas para manejar grandes volúmenes de información. El Support Vector Machine (SVM) es un algoritmo de aprendizaje supervisado utilizado en diversas áreas, incluido el campo de eDiscovery. En eDiscovery, el SVM se aplica principalmente para la clasificación y categorización automatizada de documentos legales y la detección de relevancia. El funcionamiento básico del SVM es el siguiente: Primero, se recopilan y preparan los datos relevantes, que suelen ser documentos legales o textos relacionados. Estos documentos se procesan y se convierten en documentos numéricos limpios para que puedan ser utilizados por el algoritmo. Esta fase se llama la limpieza. Ya empeza el modelo. Primero los usuarios humanos establecen las clases o categorías que se desean identificar en los documentos, como "relevante para la demanda" y "no relevante para la demanda" o "privilegiado" y "no privilegiado". Se toma una muestra de documentos. Cada documento se etiqueta manualmente según su clase correspondiente. SVM funciona transformando el dato en espacio de características de grandes dimensiones de forma que las categorias se pueden describir bajo las carasteristicas. Estes espacios de grande dimension se llaman hiperplanos, en referencia a la geometría tridimensional, donde un plano se puede definir de manera única mediante la especificación de tres puntos (o dimensiones) no colineales. Estos tres puntos proporcionan la información necesaria para determinar el plano en el espacio tridimensional. Al elegir tres puntos no alineados, se garantiza que no haya ambigüedad en la ubicación y orientación del plano. Los puntos actúan como puntos de referencia clave que definen la posición y extensión del plano en el espacio. De la misma manera, una categoria de documentos se define de manera unica mediante la especificación de n puntos de características. El SVM requiere de un proceso de entrenamiento para construir un modelo que pueda clasificar los documentos en sus respectivos hiperplanos. Durante el entrenamiento, se presentan al algoritmo un conjunto de documentos ya etiquetados manualmente con sus clases correspondientes. El SVM busca encontrar los hiperplanos óptimos que maximizan la separación entre las categorias en el espacio de características. Ahora tenemos un analisis que define cada de manera unica cada categoria. Tras ello, las características de los nuevos datos se pueden utilizar para predecir el grupo al que pertenece el nuevo registro. A partir de los documentos procesados, se extraen características relevantes que describen el contenido de los textos. Estas características pueden incluir la frecuencia de ciertas palabras o términos, la longitud de los documentos, la estructura gramatical, entre otros. Una vez que el modelo SVM ha sido entrenado, se puede utilizar para clasificar nuevos documentos que no fueron parte del conjunto de entrenamiento. El algoritmo asignará una clase a cada documento en función de su posición con respecto al hiperplano óptimo determinado durante el entrenamiento. En el contexto de eDiscovery, el SVM se utiliza para automatizar la clasificación de documentos legales en diferentes categorías relevantes para el proceso de descubrimiento de pruebas. Por ejemplo, puede ayudar a identificar documentos relevantes para un caso específico, distinguir entre documentos privilegiados y no privilegiados, o agrupar documentos relacionados por temas. El SVM tiene la capacidad de manejar conjuntos de datos complejos y de alta dimensionalidad, lo que lo hace adecuado para el análisis de grandes volúmenes de documentos en eDiscovery. Sin embargo, es importante destacar que el éxito del SVM en eDiscovery depende en gran medida de la calidad y representatividad de los datos de entrenamiento, así como de la selección adecuada de las características relevantes para la clasificación. Eso fue la aplicación la mas profunda que inteligencia artificial que he visto en el pasado. Para dar otro ejemplo, vi un caso muy impresionante en una convención que me hizo reflexionar sobre la diferencia entre inteligencia artificial y machine learning desde mi punto de vista. Durante la presentación, se nos pidió a algunos asistentes que entráramos al escenario y colocáramos piedras en un recipiente de forma aleatoria, ya sea formando una pila larga o varias pilas pequeñas. Era evidente que no había ningún patrón o lógica en la disposición de las piedras. Después de eso, entraron en escena los robots, y parecían salidos de una película de animación de Disney. Marchaban en perfecta sincronía, haciendo ese característico ruido "zwuit zwuit" de los robots. Observé asombrado cómo los robots analizaban la disposición de las piedras en el recipiente, se comunicaban entre sí y se coordinaban para recoger las piedras de manera óptima y volver a colocarlas en la caja. Ese momento me hizo comprender la diferencia entre inteligencia artificial y machine learning desde mi perspectiva. Los robots exhibían inteligencia artificial al ser capaces de analizar, tomar decisiones y realizar acciones de forma autónoma. Estaban programados con algoritmos complejos y reglas lógicas que les permitían comprender el entorno y optimizar su tarea. Sin embargo, lo que me impresionó aún más fue la capacidad de aprendizaje de los robots, lo que se relaciona directamente con el machine learning. A medida que interactuaban con las piedras y se comunicaban entre sí, los robots aprendían de la experiencia y mejoraban su desempeño. No estaban simplemente siguiendo un conjunto rígido de instrucciones, sino que estaban adaptándose y ajustándose en tiempo real para lograr un resultado óptimo. Ese ejemplo me hizo darme cuenta de que la inteligencia artificial y el machine learning son dos aspectos interrelacionados pero distintos. La inteligencia artificial se refiere a la capacidad de las máquinas para imitar la inteligencia humana, mientras que el machine learning se centra en el desarrollo de algoritmos y modelos que permiten a las máquinas aprender y mejorar a partir de la experiencia y los datos. En resumen, presenciar el impresionante desempeño de esos robots en la convención me hizo comprender desde mi perspectiva cómo la inteligencia artificial y el machine learning se unen para lograr resultados sorprendentes. Los robots demostraron tanto inteligencia artificial al tomar decisiones autónomas como machine learning al aprender y adaptarse a medida que interactuaban con su entorno. Interactúas con "machine learning" todos los días. Cuando Netflix te sugiere una película o un motor de búsqueda completa tu consulta, eso es el machine learning en acción. En la proxima lección vamos a ver que tipos de algoritmos hay.

12. Un caso real

Entradas recientes

Comments

Suscríbete a nuestro boletín