Hand Emoji Images Aprovecha el 25% de descuento para este invierno 2024.

Cápsulas

Cápsulas de Contenido (Video, Audio, Texto) sobre diferentes temas relacionados a Inteligencia Artificial y Desarrollo.

  • PAPER | 21 feb 2024

Can Similarity-Based Domain-Ordering Reduce Catastrophic Forgetting for Intent Recognition?

Los sistemas de dialogo orientados a tareas deben gestionar un conjunto de intenciones y dominios en constante expansion, incluso despues de su implementacion para soportar mas y mas funcionalidades. Para cumplir con esta expectativa, resulta critico mitigar el problema del olvido catastrofico (CF) que ocurre en los ajustes de aprendizaje continuo (CL) para una tarea como el reconocimiento de intenciones. Si bien la investigacion en sistemas de dialogo existentes ha explorado metodos basados en repeticion y en regularizacion para este fin, el efecto del orden de los dominios en el rendimiento de CL de los modelos de reconocimiento de intenciones sigue sin explorarse. El orden de los dominios, si se entiende bien, tiene el potencial de ser una tecnica ortogonal que se puede aprovechar junto con tecnicas existentes como la repeticion de experiencias. Nuestro trabajo llena este vacio al comparar el impacto de tres estrategias de ordenacion de dominios (ruta de suma minima, ruta de suma maxima, aleatorio) en el rendimiento de CL de un modelo generativo de reconocimiento de intenciones. Nuestros hallazgos revelan que la estrategia de ruta de suma minima supera a las demas en la reduccion del olvido catastrofico al entrenar con el modelo T5-Base de 220M. Sin embargo, esta ventaja disminuye con el modelo T5-Large mas grande de 770M. Estos resultados subrayan el potencial del orden de los dominios como una estrategia complementaria para mitigar el olvido catastrofico en los modelos de reconocimiento de intenciones de aprendizaje continuo, particularmente en escenarios con recursos limitados.

  • PAPER | 21 feb 2024

Double-I Watermark: Protecting Model Copyright for LLM Fine-tuning

Los propietarios de negocios a menudo buscan modelos personalizados para respaldar varias aplicaciones, que se obtienen ajustando un LLM preentrenado. Sin embargo, este proceso conlleva un riesgo sustancial de uso indebido del modelo. Por lo tanto, proteger los derechos de autor de estos modelos personalizados durante el ajuste fino del LLM se ha convertido en un requisito practico urgente, pero existen soluciones limitadas para brindar dicha proteccion. Proponemos un nuevo enfoque de marca de agua llamado "marca de agua de doble I". Al aprovechar la capacidad de aprendizaje del LLM para incorporar muestras de puerta trasera personalizadas en el conjunto de datos, el enfoque propuesto inyecta efectivamente informacion especifica de marca de agua en el modelo personalizado durante el ajuste fino, lo que facilita la inyeccion y verificacion de marcas de agua en escenarios comerciales.

  • PAPER | 27 feb 2024

Attention-GAN for Anomaly Detection: A Cutting-Edge Approach to Cybersecurity Threat Management

Este articulo propone un marco innovador Attention-GAN para mejorar la ciberseguridad, centrandose en la deteccion de anomalias. En respuesta a los desafios planteados por la naturaleza en constante evolucion de las amenazas ciberneticas, el enfoque propuesto tiene como objetivo generar escenarios de ataque sinteticos diversos y realistas, enriqueciendo asi el conjunto de datos y mejorando la identificacion de amenazas.

  • AI TOOLS | 26 mar 2024

Balance

Balance es una herramienta de IA impulsada por texto que proporciona respuestas completas, bien escritas e informativas a preguntas complejas.

  • PAPER | 21 mar 2024

Knowledge-Enhanced Recommendation with User-Centric Subgraph Network

Los sistemas de recomendacion basados en KG han surgido como una solucion prometedora para abordar las limitaciones de los metodos clasicos. Sin embargo, la mayoria de los metodos basados en KG adoptan incrustaciones de nodos, que no brindan recomendaciones personalizadas para diferentes usuarios y no pueden generalizarse bien a los nuevos elementos. Para abordar estas limitaciones, proponemos Knowledge-enhanced User-Centric subgraph Network (KUCNet), un enfoque de aprendizaje de subgrafos con red neuronal de grafos (GNN) para una recomendacion efectiva. KUCNet construye un subgrafo U-I para cada par usuario-elemento que captura tanto la informacion historica de las interacciones usuario-elemento como la informacion secundaria proporcionada en KG. Se disena una GNN basada en la atencion para codificar los subgrafos UI para la recomendacion. Teniendo en cuenta la eficiencia, se introduce ademas el grafico de computacion centrado en el usuario podado, de modo que se puedan computar simultaneamente multiples subgrafos UI y que el tamano se pueda podar mediante Personalized PageRank. Nuestro metodo propuesto logra recomendaciones precisas, eficientes e interpretables, especialmente para nuevos elementos. Los resultados experimentales demuestran la superioridad de KUCNet sobre los metodos de colaboracion filtrada (CF) basados en KG y el estado de la tecnica.

  • AI TOOLS | 26 mar 2024

Animaker’s Subtitle Generator

Animaker's Subtitle Generator es una herramienta de IA que genera subtítulos precisos y sincronizados a partir de archivos de audio y vídeo, lo que facilita la creación de contenido accesible y atractivo.

  • PAPER | 18 feb 2024

Evaluating the Effectiveness of Index-Based Treatment Allocation

Cuando los recursos son escasos, se necesita una politica de asignacion para decidir quien recibe un recurso. Este problema ocurre, por ejemplo, al asignar recursos medicos escasos y a menudo se resuelve utilizando metodos modernos de ML. Este articulo presenta metodos para evaluar las politicas de asignacion basadas en indices, que asignan un numero fijo de recursos a quienes mas los necesitan, utilizando datos de un ensayo de control aleatorio. Estas politicas crean dependencias entre agentes, que invalidan los supuestos detras de las pruebas estadisticas estandar y limitan la eficacia de los estimadores.

  • PAPER | 21 mar 2024

MOGAM: A Multimodal Object-oriented Graph Attention Model for Depression Detection

La deteccion temprana es crucial en el tratamiento de la depresion. MOGAM es un modelo escalable y versatil que detecta la depresion en las redes sociales aprovechando los datos multimodales. MOGAM logro una precision del 0,871 y una puntuacion F1 del 0,888. Tambien se evaluo su rendimiento con un conjunto de datos de referencia, logrando resultados comparables con estudios previos (puntuacion F1 de 0,61).

  • PAPER | 29 feb 2024

Functional Benchmarks for Robust Evaluation of Reasoning Performance, and the Reasoning Gap

Proponemos un marco para evaluar de forma robusta las capacidades de razonamiento de los modelos de lenguaje, utilizando variantes funcionales de los benchmarks. Los modelos que resuelven una prueba de razonamiento no deberian mostrar ninguna diferencia en el rendimiento sobre la version estatica de un problema en comparacion con una instantanea de la variante funcional. Hemos reescrito el fragmento relevante del benchmark MATH en su variante funcional MATH(), con la funcionalizacion de otros benchmarks a seguir. Al evaluar los modelos actuales de ultima generacion sobre instantaneas de MATH(), encontramos una brecha de razonamiento: el porcentaje de diferencia entre las precisiones estatica y funcional. Encontramos brechas de razonamiento del 58,35% al 80,31% entre los modelos de ultima generacion de pesos cerrados y abiertos que funcionan bien en benchmarks estaticos, con la advertencia de que es probable que las brechas sean mas pequenas con estrategias de aviso mas sofisticadas. Aqui mostramos que los modelos que anecdoticamente tienen un buen rendimiento de razonamiento sobre tareas del mundo real, tienen brechas cuantificables mas bajas, lo que motiva el problema abierto de construir modelos de "brecha 0". El codigo para la evaluacion y los nuevos conjuntos de datos de evaluacion, tres instantaneas de MATH(), estan disponibles publicamente en https://github.com/consequentai/fneval/.