banner
Hogar / Blog / Examen de solicitudes de patentes relacionadas con invenciones de inteligencia artificial (IA): los escenarios
Blog

Examen de solicitudes de patentes relacionadas con invenciones de inteligencia artificial (IA): los escenarios

Jun 17, 2023Jun 17, 2023

Publicado el 22 de septiembre de 2022

© Derechos de autor de la corona 2022

Esta publicación tiene licencia bajo los términos de Open Government License v3.0 excepto donde se indique lo contrario. Para ver esta licencia, visite nationalarchives.gov.uk/doc/open-government-licence/version/3 o escriba al Equipo de Políticas de Información, The National Archives, Kew, Londres TW9 4DU, o envíe un correo electrónico a: [email protected]. Reino Unido.

Cuando hayamos identificado información de derechos de autor de terceros, deberá obtener el permiso de los titulares de los derechos de autor en cuestión.

Esta publicación está disponible en https://www.gov.uk/government/publications/examining-patent-applications-relating-to-artificial-intelligence-ai-inventions/examining-patent-applications-relating-to-artificial-intelligence -ai-inventa-los-escenarios

1.Este documento contiene un conjunto de 'escenarios' relacionados con invenciones que involucran inteligencia artificial (IA) o aprendizaje automático (ML). Está diseñado para acompañar las directrices para el examen de solicitudes de patentes relacionadas con invenciones de IA. Las directrices se ocupan principalmente de la patentabilidad de las invenciones de IA con respecto a las disposiciones de materia excluida establecidas en la sección 1(2) de la Ley de Patentes de 1977.

2. La IPO considera que las patentes están disponibles para las invenciones de IA en todos los campos de la tecnología. Los escenarios de este documento pretenden reflejar e ilustrar la amplia gama de diversos campos técnicos en los que se pueden encontrar inventos de IA.

3.Cada escenario tiene una descripción muy breve de cómo funciona su invención de IA y un ejemplo ilustrativo de un reclamo de patente. Cada escenario incluye una evaluación simplificada que establece nuestra opinión sobre cómo se evaluaría probablemente cada invención de IA con respecto a la sección 1(2).

4. Para evitar dudas, destacamos que este documento no es fuente de derecho. Nuestras opiniones sobre la patentabilidad de los escenarios no serán vinculantes para ningún propósito según la Ley de Patentes de 1977.

5. Los escenarios se han diseñado para centrarse únicamente en la cuestión de la materia excluida. Hemos asumido que las invenciones reivindicadas son nuevas y no obvias. También hemos supuesto que cada escenario está suficientemente revelado.

6. Las evaluaciones de la materia excluida que damos siguen una aplicación simplificada del enfoque de Aerotel de cuatro pasos. Hemos omitido la consideración detallada de los pasos 1 y 2 del enfoque de Aerotel. Específicamente: a. En el paso 1, simplemente asumimos que cada reclamo es lo suficientemente claro y que no surgen problemas de construcción. b. En el paso 2, hemos simplificado la evaluación indicando lo que consideramos que es la contribución real c. En los pasos 3 y 4, hemos simplificado el análisis centrándonos principalmente en la exclusión del "programa para una computadora" de la sección 1(2). A menos que se indique lo contrario, nuestras opiniones no vinculantes se limitan a esta exclusión.

7. Cualquier comentario o pregunta que surja de estos escenarios debe dirigirse a:

Phil ThorpeOficina de propiedad intelectualCasa conceptualCardiff RoadNewportGales del SurNP10 8QQ

(Teléfono 01633 813745) Correo electrónico: Phil Thorpe

Nigel HanleyOficina de propiedad intelectualCasa conceptualCardiff RoadNewportGales del SurNP10 8QQ

Teléfono 01633 814746 Correo electrónico: Nigel Hanley

Antecedentes Esta invención se refiere a un sistema de gestión de estacionamiento ubicado en una instalación de estacionamiento de automóviles equipada con cámaras de vigilancia.

Las imágenes de las cámaras del sistema son procesadas por una primera red neuronal que está entrenada para detectar un vehículo que se aproxima a la entrada de la instalación. Cuando la primera red neuronal detecta un vehículo que se aproxima en una imagen, la imagen pasa a una segunda red neuronal para implementar un sistema de reconocimiento automático de matrículas (ANPR). La segunda red neuronal está entrenada para identificar una región de matrícula específica en la imagen. Un módulo de reconocimiento recibe la región de matrícula identificada y aplica un algoritmo de reconocimiento de caracteres ópticos para determinar el número de matrícula del vehículo.

Un sistema de reconocimiento de matrículas que comprende: un dispositivo de captura de imágenes colocado en la entrada de un estacionamiento; un dispositivo informático para recibir imágenes del dispositivo de captura de imágenes y que comprende: una primera red neuronal configurada para detectar un vehículo en una imagen capturada; una segunda red neuronal configurada para recibir una indicación del vehículo desde la primera red neuronal, detectar la presencia de una placa de matrícula en la imagen y determinar una región de interés en la que se encuentra la placa de matrícula; y un módulo de reconocimiento configurado para recibir la región de interés y aplicar un proceso de reconocimiento óptico de caracteres a la región de interés para determinar caracteres de un número de registro del vehículo.

La contribución

Más allá de un sistema de vigilancia convencional que tiene una cámara y una computadora, la contribución que hace la invención es:

un sistema de reconocimiento de matrículas que utiliza una primera red neuronal para detectar un vehículo en una imagen capturada; una segunda red neuronal para detectar la presencia de una matrícula en la imagen y determinar una región de interés en la que se encuentra la matrícula, y un módulo para aplicar un proceso de reconocimiento óptico de caracteres en la región de interés para determinar los caracteres de el número de registro del vehículo.

La contribución es un sistema de reconocimiento de matrículas que no está excluido por la sección 1(2). Aunque el sistema de reconocimiento de matrículas está implementado por ordenador, es más que un programa para un ordenador como tal porque está realizando un proceso técnico externo a un ordenador. El sistema de reconocimiento de matrículas incluye una combinación de dos redes neuronales y un módulo de reconocimiento que realizan específicamente operaciones de procesamiento de imágenes que son de naturaleza técnica (ver Vicom). El sistema tiene un efecto técnico en el sentido de la señal (i). Evidentemente, resuelve un problema técnico relacionado con el reconocimiento de placas de matrícula de vehículos, por lo que la señal (v) también apuntaría a la admisibilidad.

La invención reivindicada no está excluida.

Los sistemas de suministro de gas son sistemas complejos que son monitoreados por múltiples sensores ubicados en el sistema de suministro y en su entorno operativo. Por lo general, un operador puede combinar y analizar los datos de los sensores para brindarle una descripción general del estado operativo, tanto de los componentes individuales dentro del sistema como del sistema en su conjunto. Esto puede ayudar al operador a identificar fallas dentro del sistema y opciones para reconfigurar el sistema.

Sin embargo, se reconoce que este enfoque requiere habilidades especializadas por parte del operador y es propenso a errores, especialmente cuando se deben considerar datos de un gran número de sensores interconectados. En particular, comprender la interdependencia de los cambios realizados en el sistema es un desafío.

Este problema ha sido reconocido por el inventor, que ha desarrollado un sistema de inteligencia artificial para recibir y categorizar datos de sensores relacionados con un sistema de suministro de gas, identificar fallas y recomendar cambios de configuración del sistema para resolver las fallas. Al hacer recomendaciones, el sistema de IA analizará el efecto que un cambio de configuración puede tener en el sistema. El sistema puede implementar un cambio de configuración recomendado en el sistema utilizando un controlador operativo automático.

Un método implementado por computadora para administrar el estado operativo de un sistema de suministro de gas utilizando sensores dentro del sistema de suministro de gas y en su entorno operativo, y caracterizado porque el método comprende un sistema de inteligencia artificial: recibir y analizar datos de los sensores; identificar condiciones de falla dentro del sistema de suministro de gas basado en el análisis; e informar las condiciones de falla y generar una solución recomendada a un controlador operativo automatizado del sistema de suministro de gas.

La contribución

La contribución es gestionar el estado de un sistema de suministro de gas mediante un sistema de inteligencia artificial que identifica las condiciones de falla en el sistema de suministro de gas, en función de los datos de los sensores relacionados con el funcionamiento del sistema de suministro de gas, e informa las condiciones de falla y las soluciones recomendadas a un sistema automatizado. controlador operativo.

La contribución no cae únicamente dentro de la exclusión del programa informático. La contribución de la invención es una solución a un problema técnico externo al ordenador en el que funciona el sistema AI, a saber, la supervisión del funcionamiento de un sistema técnico externo (un sistema de suministro de gas) en busca de condiciones de fallo. Esta es una contribución técnica. Las señales (i) y (v) apuntan a la permisibilidad.

La invención definida en la reivindicación no está excluida bajo la sección 1(2).

El análisis del movimiento de un objeto se puede utilizar para identificar una actividad. En algunos ejemplos conocidos, como los eventos deportivos, el análisis del movimiento de un objeto puede ser útil para el entrenamiento. Alternativamente, en los sistemas basados ​​en gestos, se puede utilizar un determinado gesto como mecanismo de control o para emitir una alarma. En un ejemplo conocido, un sistema para dejar de fumar genera una alarma en un dispositivo que se lleva en la muñeca para disuadir al usuario de fumar.

Normalmente, estos sistemas conocidos funcionan comparando datos en tiempo real con modelos estadísticos para determinar el movimiento, y dependen en gran medida de la precisión de su modelo estadístico. En consecuencia, los sistemas que se basan en modelos estadísticos pueden ser inexactos.

El inventor ha propuesto un sistema que utiliza vectores de movimiento derivados de la aceleración, la velocidad y la orientación en las direcciones X, Y y Z como entrada a una red neuronal para clasificar el movimiento. El sistema funciona al recibir datos de movimiento en tiempo real desde un dispositivo como un reloj deportivo u otros sensores de movimiento. La red neuronal procesa el vector de movimiento utilizando una biblioteca de clasificación para clasificar el movimiento en un movimiento particular.

Un dispositivo implementado por computadora para analizar el movimiento que comprende: un controlador que tiene una interfaz de datos, una red neuronal y una biblioteca de clasificación de movimiento; sensores que incluyen un giroscopio, un magnetómetro y un acelerómetro, en el que los datos de cada sensor se envían al controlador. a través de la interfaz de datos; caracterizado porque el controlador puede funcionar para: determinar un vector de movimiento a partir de los datos recibidos; y proporcionar el vector de movimiento determinado a la red neuronal, en el que la red neuronal está configurada para clasificar el vector de movimiento como uno de un movimiento particular en la biblioteca de clasificación.

La contribución

La contribución es un dispositivo que determina un vector de movimiento a partir de los datos capturados por sus sensores (giroscopio, magnetómetro, acelerómetro) y utiliza una red neuronal y una biblioteca de clasificación para clasificar el vector de movimiento como un movimiento de la biblioteca.

La contribución no es únicamente un programa para una computadora, ya que su tarea es realizar un proceso de clasificación de datos de sensores medidos que describen el movimiento físico de un dispositivo informático. Este proceso es un proceso técnico que se encuentra fuera del dispositivo informático y se lleva a cabo por medios técnicos. Se trata de la clasificación de datos de sensores del mundo real como un movimiento determinado. La señal (i) apuntaría a la patentabilidad.

La invención definida en la reivindicación no está excluida bajo la sección 1(2).

La cavitación en un sistema de bombeo es la formación de burbujas de vapor en la región del flujo de entrada de la bomba, lo que puede provocar un desgaste acelerado y daños mecánicos en los sellos, cojinetes y otros componentes de la bomba, acoplamientos mecánicos, trenes de engranajes y componentes del motor.

Un sistema de bomba tiene un aparato de medición adaptado para medir datos de flujo y presión de la bomba asociados con el sistema de bomba. Un sistema clasificador detecta la cavitación de la bomba según los datos de caudal y presión. El sistema clasificador comprende una red neuronal que se entrena utilizando retropropagación. Los dispositivos de medición comprenden sensores (1, 2) para medir la presión de entrada y la presión de salida asociadas con una entrada (3) y una salida (4), respectivamente, del sistema de bomba. También se mide el flujo a través de la bomba.

1. Un método para entrenar un sistema clasificador de red neuronal para detectar cavitación en un sistema de bomba, el método incluye los pasos de: correlacionar cada uno de una pluralidad de pares de datos de flujo y presión medidos de la bomba con uno de una pluralidad de valores de clase, produciendo así un conjunto de datos de entrenamiento, en el que cada uno de los valores de clase de la pluralidad es indicativo de un grado de cavitación dentro del sistema de bombeo y al menos uno de la pluralidad de valores de clase es indicativo de que no hay cavitación en el sistema de bombeo; y entrenar el sistema clasificador de redes neuronales utilizando el conjunto de datos de entrenamiento y la retropropagación.

2. Un método para detectar cavitación en un sistema de bombeo que comprende: medir los datos de flujo y presión de la bomba; detectar la cavitación de la bomba de acuerdo con dichos datos de flujo y presión; en el que el paso de detección incluye proporcionar dichos datos de flujo y presión como entradas a un sistema clasificador utilizando un red neuronal entrenada, en la que la red neuronal proporciona una señal indicativa de la existencia y el alcance de la cavitación en el sistema de bombeo, y actualiza dicha señal (6) durante el funcionamiento de dicho sistema de bombeo.

La contribución

Comenzando con la reivindicación 1, la contribución que hace es un método implementado por computadora para entrenar (es decir, configurar) un clasificador de red neuronal para que pueda detectar cavitación en un sistema de bombeo, donde el método usa propagación hacia atrás con un conjunto de datos de entrenamiento que comprende mediciones del flujo de la bomba y la presión del sistema de bombeo, cada uno de los cuales está correlacionado con un valor que indica el grado correspondiente de cavitación de la bomba en el sistema.

Aunque la contribución se basa en un programa de computadora, es más que un programa de computadora como tal. La contribución se relaciona con un proceso de uso de datos físicos para entrenar a un clasificador para un propósito técnico específico, a saber, la detección de cavitación en un sistema de bombeo. Esto es de naturaleza técnica. Hay una contribución técnica en el sentido de la señal (i).

La reivindicación 2 también revela una contribución técnica ya que se relaciona con el uso de un clasificador entrenado para el propósito técnico específico de detectar cavitación en el sistema de bombeo. Se realiza un proceso técnico que se encuentra fuera de la computadora en el sentido de la señal (i).

La invención definida en las reivindicaciones 1 y 2 no está excluida bajo la sección 1(2).

Muchos automóviles están equipados con convertidores catalíticos para reducir la cantidad de gases como NOx y CO en sus gases de escape. Un problema para tales convertidores es que su eficiencia operativa cambia con la relación de combustible a aire en las cámaras de combustión del motor. Por lo tanto, la relación combustible-aire debe controlarse para que se mantenga en un valor fijo para mantener el funcionamiento eficiente del convertidor catalítico.

Se sabe cómo controlar la cantidad de combustible inyectado en la cámara de combustión de un motor utilizando control de avance en relación con la posición del acelerador y control de retroalimentación adicional en relación con un sensor de oxígeno (o sensor de aire/combustible) dispuesto en el escape. Aunque esto funciona bien, puede ser difícil controlar correctamente la relación aire-combustible cuando el motor está acelerando o desacelerando.

El inventor ha desarrollado un sistema de control de inyectores que utiliza una red neuronal entrenada para determinar la cantidad por la cual se debe ajustar una cantidad de inyección de combustible dada durante la aceleración/desaceleración para mantener una relación correcta de combustible a aire y así mantener la eficiencia del convertidor catalítico. La red neuronal recibe entradas de datos relacionadas con el estado operativo del motor, como la velocidad del motor (RPM), la presión del aire de admisión, la posición del acelerador, la cantidad de inyección de combustible, la temperatura del aire de admisión, la temperatura del refrigerante del motor y datos de un sensor de gases de escape. La red neuronal emite una señal que indica un cambio en la cantidad de inyección de combustible para controlar el motor.

Una red neuronal implementada por computadora para ajustar la cantidad de combustible inyectado en un cilindro de un motor de combustión, la red neuronal comprende: una capa de entrada que tiene: una entrada para recibir las RPM del motor; una entrada para recibir la presión del aire de admisión del motor; una entrada para recibir la posición actual del acelerador; una entrada para recibir la cantidad actual de combustible inyectado; una entrada para recibir la temperatura del aire de admisión; una entrada para recibir la temperatura del agua de enfriamiento; una entrada para recibir los datos del sensor de gases de escape; al menos una capa oculta , en el que la capa oculta está conectada a la capa de entrada; una capa de salida conectada a la al menos una capa oculta; y en el que la capa de salida tiene una salida que indica una cantidad en la que debe cambiarse la inyección de combustible.

La contribución

La contribución es una red neuronal que emite una señal de control relacionada con una cantidad en la que se debe cambiar la inyección de combustible en función de las entradas relacionadas con el estado operativo del motor, como se define en la reivindicación.

La contribución es una solución a un problema técnico que se encuentra fuera de una computadora, es decir, mantener la relación aire-combustible correcta en un motor, por lo que es más que un programa para una computadora como tal. La red neuronal toma como entrada datos que representan el estado operativo del motor y emite una señal de control que indica la cantidad en la que debe cambiar la cantidad de inyección de combustible. La señal de control es adecuada para controlar un proceso técnico que existe fuera de la computadora en la que se ejecuta la red neuronal. Esta es una contribución técnica. Se aplican las señales (i) y (v).

La invención definida en la reivindicación no está excluida bajo la sección 1(2).

Es útil medir el porcentaje de sangre que sale de cada ventrículo de un corazón para determinar la salud del corazón. Esta medida puede ser estimada por un operador experto de un sistema de formación de imágenes por ultrasonidos formando imágenes de un corazón y marcando y midiendo los límites de los ventrículos del corazón en cualquier extremo de un latido cardíaco. Sin embargo, la precisión de la estimación del operador depende de la habilidad y el juicio del operador.

El inventor ha ideado un método en el que se usa una red neuronal entrenada para proporcionar una medida del porcentaje de sangre expulsada por un corazón mediante el análisis de una serie de imágenes del corazón durante un latido. La red neuronal se entrena utilizando un enfoque de aprendizaje supervisado.

Un método implementado por computadora para determinar un porcentaje de sangre expulsada de un corazón dado durante un latido, el método comprende: entrenar una red neuronal con conjuntos de datos de imágenes del corazón, cada conjunto comprende datos de imágenes de un ventrículo a lo largo del tiempo y porcentajes de eyección de sangre asociados, estando asociados los conjuntos con diferentes corazones; y usando la red neuronal entrenada para: recibir un conjunto de datos de imágenes de un ventrículo del corazón dado; generar un porcentaje de eyección de sangre para el corazón dado.

La contribución

La contribución es un método para estimar un porcentaje de sangre expulsada de un corazón entrenando una red neuronal con datos de imágenes del corazón que se ha etiquetado con el porcentaje de eyección de sangre y luego obteniendo una estimación del porcentaje de sangre expulsada de un corazón determinado durante un latido del corazón al proporcionar un conjunto de imágenes de ese corazón (sobre su latido) a la red neuronal entrenada.

La contribución es más que un programa para una computadora como tal porque se relaciona con una medición mejorada del porcentaje de sangre expulsada de un corazón durante un latido. Esta es una medida técnica de un sistema físico. Esta medición mejorada es un ejemplo de un efecto técnico sobre un proceso que se encuentra fuera de la computadora que implementa la invención, siguiendo el indicador (i). Esta es una contribución técnica.

La invención no está excluida bajo la sección 1(2).

Los comerciantes en una bolsa comercial monitorean el desempeño de varias acciones e instrumentos negociables para tratar de identificar oportunidades para realizar una operación beneficiosa. Requiere conocimiento especializado, comprensión y experiencia para reconocer e identificar patrones y tendencias en el mercado. Esto significa que los comerciantes a menudo se especializarán en una gama limitada de instrumentos, por ejemplo, acciones de energía, derivados financieros o materias primas.

El inventor ha reconocido que esto puede dar lugar a que se pasen por alto intercambios beneficiosos. Un comerciante puede perder una oportunidad de negociación de instrumentos mantenidos como parte de su posición o la oportunidad de reducir una pérdida o aumentar una ganancia de una transacción. Para ayudar al comerciante, el inventor ha desarrollado una IA que puede identificar patrones y correlaciones entre los precios de las acciones y los instrumentos, identificar transacciones basadas en el rendimiento reciente y las diferencias de tiempo, y predecir comportamientos futuros. Una ventaja que ofrece la IA es la oportunidad de "ver" conexiones que de otro modo serían opacas y no obvias.

La IA está acoplada a una plataforma de corretaje automático que le permite ejecutar operaciones de acuerdo con los límites de ganancias/pérdidas proporcionados por el comerciante.

Un sistema de comercio de instrumentos financieros implementado por computadora que comprende un mercado de intercambio, una terminal de corredor, un asistente de IA y un sistema de corretaje automatizado, caracterizado porque el asistente de IA está configurado para: recibir datos de precios actuales e históricos para instrumentos financieros negociables de los intercambios ;combinaciones de referencias cruzadas de instrumentos financieros para identificar grupos de instrumentos correlacionados;identificar tendencias dentro de cada grupo correlacionado;recibir posiciones de comerciantes desde la terminal del corredor; y en función de las tendencias identificadas y las posiciones de los comerciantes, emitir instrucciones de transacción automatizadas al sistema de corretaje automatizado.

La contribución

La contribución es un sistema de negociación de instrumentos financieros implementado por computadora que tiene un asistente de inteligencia artificial para monitorear las correlaciones entre los instrumentos negociables e implementar transacciones automatizadas de acuerdo con los límites de ganancias/pérdidas establecidos por un comerciante.

La contribución se refiere enteramente a un método de hacer negocios como tal. Todas las entradas y salidas del sistema se relacionan puramente con la negociación de instrumentos financieros, ya sean precios o instrucciones de negociación. El resultado de la invención no es más que un sistema de negociación de instrumentos financieros. Esto no cuenta como una contribución técnica.

La invención reivindicada está excluida de la protección por patente en virtud de la sección 1(2) porque es un método de hacer negocios como tal.

Identificar las necesidades de salud actuales y futuras de las personas es una tarea importante. La naturaleza misma de los problemas de salud a menudo significa que un sistema de salud es más reactivo que proactivo. Como tal, identificar la demanda futura a nivel personal y de población suele ser difícil.

El inventor ha descubierto que es posible usar técnicas de aprendizaje automático para analizar los registros de salud de los pacientes para asignar a los pacientes a grupos de riesgo o subpoblaciones donde se puede requerir una futura intervención de salud. Esto puede permitir a los planificadores de salud "evaluar la población" e identificar grupos de pacientes adecuados dentro de la población para ensayos de medicamentos o tratamientos alternativos.

El sistema utiliza un dispositivo de IA para tomar los registros de salud de una población de pacientes. El dispositivo de IA identifica variables empíricas en los registros de salud, busca correlaciones entre variables y usa variables correlacionadas para crear marcadores que pueden usarse para identificar grupos de pacientes en la población. Los registros de salud del paciente incluirán necesariamente registros administrativos, pero también podrán incluir antecedentes de tratamientos previos y detalles de resultados de pruebas médicas.

Un método implementado por computadora para identificar las necesidades médicas futuras de una población, realizado por un dispositivo de IA, el método comprende los pasos de: ingresar registros de pacientes en el dispositivo de IA; agregar datos de los registros de pacientes; identificar una pluralidad de variables del agregado datos; identificar correlaciones entre las variables; asignar pacientes a grupos sobre la base de las variables correlacionadas; y generar un rango de métricas de salud para cada grupo.

La contribución

La contribución de la invención se identifica como: un método implementado por computadora para analizar datos de pacientes y agrupar pacientes en grupos sobre la base del análisis.

La contribución consiste únicamente en materia excluida. Es un programa que simplemente analiza el contenido de la información de los datos del paciente y no es más que un programa para una computadora como tal. La invención no representa un proceso técnico externo a una computadora, ni contribuye a la solución de un problema técnico externo a una computadora. Además, analizar los datos de los pacientes para determinar las agrupaciones de pacientes es una tarea totalmente administrativa y no es más que un método de hacer negocios como tal.

La invención reivindicada se excluye como un programa para una computadora como tal y/o como un método para hacer negocios como tal.

Muchos usuarios ven los correos electrónicos no solicitados o recibidos como una molestia. Estos correos electrónicos a menudo llenan los buzones y potencialmente evitan que el usuario vea comunicaciones importantes. Para hacer frente a esta situación, existen muchos sistemas conocidos basados ​​en reglas para identificar estos mensajes como basura y moverlos a un buzón de correo electrónico no deseado (o similar de baja prioridad).

El inventor se ha dado cuenta de que estos enfoques conocidos tienen limitaciones ya que un conjunto de reglas no se adaptará a todos los usuarios. Lo que es correo electrónico no deseado para un usuario no lo es necesariamente para otro. Además, los remitentes de correo electrónico no deseado adaptarán lo que envían a cualquier conjunto de reglas determinado.

Para contrarrestar estos problemas, el inventor ha desarrollado un sistema de inteligencia artificial que aprende a través de los comentarios de los usuarios. El sistema funciona analizando el texto de todos los correos electrónicos entrantes utilizando un clasificador de IA capacitado para clasificar el correo electrónico según su contenido y estructura semántica. El clasificador de IA se entrena en un corpus de correos electrónicos previamente clasificados. El clasificador de IA clasifica el correo electrónico recibido como basura, no basura o inseguro. El usuario puede clasificar manualmente los correos electrónicos que se identifican como 'no seguros'. El correo electrónico y su clasificación se utilizan luego para ajustar adecuadamente el entrenamiento del clasificador de IA.

El sistema completo proporciona un sistema de filtrado de correo electrónico no deseado que se adapta a las necesidades del usuario y al comportamiento cambiante de los creadores de correo electrónico no deseado.

Un método implementado por computadora para identificar un mensaje electrónico recibido como perteneciente a una clase de mensaje, el método comprende los pasos de: analizar el contenido del mensaje usando un clasificador de IA entrenado que clasifica el contenido, de acuerdo con su contenido textual y estructura semántica, como primera clase, segunda clase o no estoy seguro; si el mensaje se clasifica como no seguro, recibir información de un usuario que clasifica el mensaje como primera o segunda clase; y actualizar el entrenamiento del clasificador de IA utilizando el mensaje clasificado por el usuario y su clasificación.

La contribución

La contribución es un método para clasificar los correos electrónicos, según el contenido textual y la estructura semática del correo electrónico, como basura o no basura mediante un clasificador de IA, donde cuando el clasificador de IA no está seguro de si un correo electrónico es basura o no, le pide a un usuario que decida y usa el resultado para actualizar el clasificador.

Esta contribución no es más que un programa para una computadora como tal. Más allá de simplemente solicitar la entrada del usuario, la contribución no hace más que analizar el contenido del texto de las comunicaciones electrónicas para determinar una clasificación para esas comunicaciones. Consiste en la mera manipulación de datos que no tiene ningún efecto técnico más allá de la ejecución de un programa en un ordenador. No hay aporte técnico. Ninguna de las señales apunta a la permisibilidad.

La invención reivindicada está excluida bajo el programa de exclusión informática de la s.1(2)

La memoria caché o el almacenamiento de alto rendimiento se utilizan comúnmente en los sistemas informáticos para mejorar el rendimiento del sistema mitigando el rendimiento más lento de un almacén de datos asociado. Los datos a los que se accede con frecuencia que se encuentran en el almacén de datos pueden almacenarse (almacenarse en caché) en la memoria caché para que, cuando sea necesario, se puedan recuperar rápidamente.

El rendimiento general de un sistema de memoria depende de la elección de los datos que se almacenarán en la memoria caché de su almacén de datos asociado. Aunque una memoria caché puede comenzar vacía, una vez que está completamente llena, se debe administrar el contenido de la memoria caché para mantener el rendimiento eliminando y reemplazando los datos almacenados en ella.

Hay dos esquemas para identificar los datos que se eliminarán de la memoria caché al agregarle nuevos datos. El primero es eliminar los datos usados ​​menos recientemente (LRU). El segundo esquema elimina los datos usados ​​con menos frecuencia pero no los nuevos (LFU). Un esquema puede conducir a un mejor rendimiento general del sistema que el otro dependiendo de los datos particulares almacenados en el caché.

El inventor ha ideado un método para gestionar el llenado de una memoria caché mediante el uso de una red neuronal entrenada para identificar si el esquema LRU o el esquema LFU conducirán al mejor rendimiento del sistema. La red neuronal toma, como entradas, los datos identificados para su eliminación por cada uno de los esquemas LRU y LFU junto con otras características de la memoria caché, por ejemplo, su tamaño y la proporción de la cantidad de veces que se encuentran los datos solicitados en la memoria caché frente a la número de veces que no lo es (lo que se conoce como proporción de aciertos y errores de caché). Luego, la red neuronal devuelve una indicación de qué esquema usar para garantizar el mejor rendimiento del sistema.

Un método para gestionar datos almacenados en una memoria caché de datos para un almacén de datos en un sistema informático que utiliza la memoria caché como un medio para almacenar datos a los que se accede con frecuencia desde el almacén de datos, comprendiendo el método: utilizar un primer algoritmo de eliminación para identificar los primeros datos a ser eliminados de la memoria caché; utilizando un segundo algoritmo de eliminación para identificar los segundos datos que se eliminarán de la memoria caché; proporcionando los primeros datos, los segundos datos, un valor de tamaño de memoria caché y una proporción de aciertos y errores de la memoria caché como entradas para una red neuronal entrenada red, en la que la red neuronal entrenada proporciona como salida una selección del primer o del segundo algoritmo a utilizar para eliminar datos de la memoria caché; y al agregar nuevos datos del almacén de datos al caché, usar el algoritmo seleccionado para eliminar datos del caché.

La contribución

La contribución es administrar los datos en un caché mediante el uso de una red neuronal para seleccionar un algoritmo de eliminación óptimo para eliminar datos del caché, la selección se basa en los datos seleccionados para la eliminación por diferentes algoritmos y características de rendimiento del caché.

La contribución es más que un programa para una computadora como tal porque se trata de resolver un problema técnico que tiene que ver con el funcionamiento interno de una computadora, es decir, mejorar cómo funciona la jerarquía de memoria en una computadora. La invención mejora el funcionamiento de una computadora independientemente de las aplicaciones que se ejecuten o la naturaleza de los datos que se procesen, y hace que la computadora sea más eficiente y eficaz. Revela un efecto técnico en el sentido de las señales (ii), (iv) y (v).

La invención definida en la reivindicación no está excluida bajo la sección 1(2).

Los actores malintencionados pueden obtener acceso a sistemas informáticos protegidos mediante la obtención de credenciales de autenticación válidas de usuarios autorizados. Pueden, por ejemplo, utilizar un ataque de phishing en el usuario para obtener su nombre de usuario y contraseña.

El inventor ha ideado un método para identificar a los malintencionados en caso de que obtengan acceso a un sistema informático, lo que permite llevar a cabo una acción correctiva. Esto se hace comparando las características de uso de los actores maliciosos con las del usuario a cuyos detalles han obtenido acceso o al que se están haciendo pasar.

El método implica entrenar un algoritmo de aprendizaje automático en un conjunto inicial de datos que representan el uso característico de un usuario para el sistema informático (por ejemplo, las aplicaciones que usan, su forma de escribir y su uso del mouse). Posteriormente, cuando alguien inicia sesión con las credenciales de ese usuario, el algoritmo de aprendizaje automático entrenado se usa para calificar la autenticidad del 'usuario' de acuerdo con un uso característico recientemente medido para el sistema informático. Si el algoritmo de aprendizaje automático indica que es probable que el 'usuario' no sea el usuario auténtico, el sistema identifica al usuario como un actor malicioso y se puede llevar a cabo una acción correctiva.

Un método implementado por computadora que comprende: autenticar a un usuario por primera vez en un sistema informático; en respuesta a la autenticación del usuario por primera vez, calcular, utilizando al menos un modelo de aprendizaje automático, una puntuación característica de comportamiento para el usuario, el comportamiento puntuación característica que caracteriza las interacciones del usuario con el sistema informático;autenticar a un usuario por segunda vez en un sistema informático;en respuesta a la autenticación del usuario por segunda vez, calcular, utilizando el modelo de aprendizaje automático, una puntuación de comportamiento que caracteriza las interacciones del usuario con el sistema informático; y determinar que el usuario autenticado en la segunda vez es un usuario malicioso en base a la puntuación característica de comportamiento calculada y la puntuación de comportamiento calculada.

La contribución

La contribución de la invención es la determinación de que un usuario que inicia sesión en un sistema informático es un usuario malintencionado en función de una puntuación de comportamiento calculada por un modelo de aprendizaje automático y una puntuación característica de comportamiento conocida para un usuario genuino calculada por el modelo de aprendizaje automático.

La contribución es más que un programa informático como tal porque es una solución a un problema técnico que se encuentra dentro del sistema informático, a saber, la detección de una intrusión maliciosa. Esto se logra monitoreando repetidamente el uso característico del sistema informático por parte de un usuario. Este es un ejemplo de monitoreo del funcionamiento interno del sistema informático que se considera de naturaleza técnica. La invención funciona independientemente de las aplicaciones que se ejecutan y los datos que se procesan en el sistema informático. Hay un efecto técnico al menos en el sentido de las señales (ii) y (v).

La invención definida en la reivindicación no está excluida bajo la sección 1(2).

Se sabe que los dispositivos de pantalla táctil permiten la entrada de texto mostrando un teclado virtual a través del cual un usuario puede introducir texto en un cuadro de texto asociado. Ingresar texto de esta manera puede requerir mucho trabajo y mucho tiempo y, dado el tamaño relativamente pequeño de muchos dispositivos, es propenso a errores del usuario al presionar teclas virtuales.

El inventor ha escrito un programa que ayuda a aliviar la carga de la entrada de texto mediante el uso de una red neuronal recurrente entrenada (RNN) para predecir las siguientes palabras probables (o entrada de cadena) dadas las palabras o puntuaciones anteriores ingresadas. Las palabras pronosticadas se clasifican y se muestra al usuario una selección de las palabras más probables. El usuario puede seleccionar la palabra mostrada y utilizarla como entrada de texto desde el teclado virtual. La invención tiene la ventaja de permitir al usuario introducir el texto deseado en el ordenador con mayor precisión y utilizando menos pulsaciones de teclas virtuales.

Un método de ingreso de texto en un dispositivo que muestra un teclado virtual interactivo, el método comprende: recibir en el dispositivo la entrada desde el teclado virtual; proporcionar la entrada a una red neuronal recurrente entrenada para predecir y clasificar una selección de palabras que es probable que sean la próxima entrada del usuario; mostrar al menos dos de las palabras más probables que se ingresen a continuación; y recibir una entrada correspondiente a una selección de una de las palabras visualizadas.

La contribución

La contribución se relaciona con la entrada de texto predictivo en un dispositivo que tiene un teclado virtual, donde una red neuronal recurrente predice y clasifica las palabras que tienen más probabilidades de ingresarse a continuación en función del texto ingresado anteriormente y permite que un usuario del dispositivo seleccione una de las palabras predichas para entrada en el dispositivo.

El aporte es más que un programa para una computadora como tal. La contribución es una solución a un problema técnico relacionado con el propio funcionamiento del dispositivo, es decir, el de mejorar la velocidad y la precisión de la entrada de texto mediante un teclado. La invención hace esto mediante la predicción de palabras para que el usuario seleccione para la entrada, de modo que el texto se introduzca usando menos pulsaciones de teclas. La invención mejora el teclado virtual, haciendo que el dispositivo sea más eficiente y efectivo para que lo use el usuario. Esta es una contribución técnica. Las señales (iv) y (v) parecen aplicarse.

La invención definida en la reivindicación no está excluida bajo la sección 1(2).

Las redes neuronales pueden ser muy grandes y complejas, con una gran cantidad de parámetros e involucrando muchos cálculos. El manejo de la gran cantidad de parámetros y cálculos requiere cantidades correspondientemente altas de memoria y recursos de procesador. Es deseable reducir estos requisitos manteniendo el beneficio de una red neuronal entrenada.

La invención logra esto proporcionando una red neuronal inicial creada y entrenada usando un enfoque convencional como modelo base. Luego, esta red neuronal entrenada se optimiza utilizando un proceso de racionalización para producir una red optimizada más simple que produce aproximadamente los mismos resultados que la red neuronal inicial dentro de un nivel de tolerancia predeterminado.

El proceso de racionalización puede implicar la eliminación de elementos selectivos del procesamiento que se está realizando, por ejemplo, eliminando nodos de la red. Los elementos pueden eliminarse porque son redundantes o tienen poco efecto en los resultados generales de la red.

Un método implementado por computadora para generar una red neuronal entrenada y optimizada que comprende los pasos de: a) procesar datos de entrada usando una red neuronal base entrenada para generar primeros datos de salida; b) generar una red neuronal optimizada mediante la racionalización de la red neuronal entrenada; c ) procesar los datos de entrada utilizando la red neuronal optimizada para generar segundos datos de salida; d) comparar los primeros y segundos datos de salida para determinar una diferencia; ye) si la diferencia supera un umbral predeterminado, generar una red neuronal optimizada adicional mediante un proceso de racionalización; yf) repetir los pasos c) a e) hasta que la diferencia esté por debajo del umbral.

La contribución

La contribución es un método implementado por computadora para generar una red neuronal optimizada mediante la racionalización de una red neuronal base entrenada, la salida de la red optimizada se compara con la de la red base y si la salida difiere más allá de un umbral, se generan iterativamente más redes optimizadas. hasta que se encuentre uno cuya salida esté dentro de una diferencia de umbral con respecto a la red base.

El aporte no es más que un programa para una computadora como tal. La contribución es un proceso iterativo de producción de una red neuronal optimizada más simple a partir de una red neuronal base. Este es simplemente un proceso iterativo para adaptar un programa de computadora (el programa que implementa la red base) para producir un programa de computadora optimizado (el programa que implementa la red neuronal optimizada). La invención no ha resuelto ningún problema técnico del propio ordenador. Cualquier reducción en la carga de procesamiento o el uso de la memoria surge solo como resultado de la ejecución del programa con menos instrucciones. Esto es una elusión de los problemas de carga del procesador y uso de la memoria abordados por la invención. No hay ningún efecto técnico más allá de la mera ejecución de un programa mejor u optimizado (como se encontró en el caso de Gale [1991] RPC 305). No hay aporte técnico.

La invención definida en la reivindicación está excluida bajo la sección 1(2) como un programa para una computadora como tal.

En general, se considera deseable reducir la cantidad de procesamiento utilizado para realizar cualquier tarea computacional. Este es particularmente el caso de las redes neuronales. El procesamiento de redes particularmente grandes puede requerir recursos informáticos significativos.

El inventor ha reconocido que en muchas aplicaciones se utiliza una red neuronal para procesar varios datos muy similares. Por ejemplo, cuando los datos de entrada tienen la forma de una serie temporal, puede haber muy pocos cambios en los datos que aparecen en ventanas temporales sucesivas de la serie temporal. Los ejemplos pueden incluir cuadros sucesivos de datos de video o información de precios de acciones muestreados a intervalos de una hora. Si la diferencia entre dos ventanas de tiempo sucesivas es lo suficientemente pequeña, es probable que la clasificación de los datos en cada una de esas ventanas con la misma red neuronal dé el mismo resultado. En tales casos, la clasificación de los datos en ventanas de tiempo sucesivas utilizando la red neuronal conduce a un esfuerzo de procesamiento redundante o innecesario.

El sistema inventivo crea un indicador para cada ventana de tiempo, por ejemplo aplicando una función hash conocida a los datos contenidos en una ventana de tiempo. El sistema utiliza el indicador para verificar las diferencias entre las ventanas de tiempo. Si el indicador de una ventana dada es diferente al de una ventana anterior, los datos de la ventana dada se envían a la red neuronal para su clasificación. Sin embargo, si el indicador para la ventana dada es el mismo, simplemente se reutiliza la clasificación producida por la red neuronal para la ventana anterior.

Un método implementado por computadora para procesar un flujo de datos continuos indexados en el tiempo usando una red neuronal, el método caracterizado por tener los pasos de: procesar una primera porción de datos de entrada que tiene un primer valor de índice de tiempo para generar un primer indicador de datos; usando la red neuronal para generar una primera salida a partir de la primera parte de los datos de entrada; almacenar el primer indicador de datos en asociación con la primera salida; procesar una segunda parte de los datos de entrada que tienen un valor de índice de tiempo subsiguiente para generar un segundo indicador de datos; comparar el segundo indicador de datos con el primer indicador de datos; donde si el segundo indicador de datos es diferente al primer indicador de datos: usar la red neuronal para generar una segunda salida; almacenar el segundo indicador de datos en asociación con la segunda salida; y si el segundo indicador de datos es el mismo que el primer indicador de datos: recuperar la primera salida.

La contribución

La contribución se identifica como un método de procesamiento de un flujo de datos, que tiene una primera y una segunda porción de datos, con una red neuronal en la que: se genera un primer resultado para la primera porción del flujo de datos procesándolo con la red neuronal, indicadores para la primera y la segunda parte del flujo de datos se generan, y si los indicadores son diferentes, se genera un segundo resultado para la segunda parte procesándolo con la red neuronal, mientras que si los indicadores son los mismos, entonces se genera un segundo resultado para la segunda parte. la segunda parte se genera reutilizando el primer resultado para la primera parte.

La contribución entra enteramente dentro del programa para una computadora como tal exclusión. El método evita la ejecución innecesaria de una red neuronal. Solo es necesario ejecutar la red neuronal para clasificar una ventana de datos dada si esa ventana de datos difiere de su ventana anterior. Aunque esto puede reducir la sobrecarga de procesamiento, este beneficio solo se siente cuando la computadora se ocupa de ejecutar el programa inventivo. No es una mejora realizada en la computadora, independientemente de las aplicaciones que se estén ejecutando. No puede considerarse como la solución de un problema técnico relacionado con el funcionamiento interno de la computadora. En definitiva, no hay un efecto técnico más allá de la mera ejecución de un programa mejor. No hay aporte técnico.

La invención definida en la reivindicación está excluida bajo la sección 1(2) como un programa para una computadora como tal.

El entrenamiento activo de una red neuronal implica probar la red neuronal para encontrar sus áreas de debilidad. Los ejemplos de datos de entrenamiento en las áreas de debilidad se utilizan luego para entrenar la red neuronal para que tenga un mejor rendimiento general.

Para proporcionar una línea de base para cualquier ejercicio de entrenamiento, es esencial que se utilice un conjunto de datos de muestra. Este es un conjunto de datos que se conoce y se puede decir que tiene resultados esperados confiables y consistentes.

El inventor se ha dado cuenta de que para cada elemento de los datos de la muestra procesados ​​por la IA, se puede llegar a un nivel de confianza para la precisión. Por ejemplo, si los datos de la muestra contienen imágenes de animales, es posible que el nivel de confianza para identificar perros sea más alto que para gatos. Al comparar el nivel de confianza con un umbral, el usuario puede identificar áreas de bajo rendimiento. Una vez identificados, se pueden utilizar más datos de entrenamiento relacionados con las áreas de bajo rendimiento para reforzar la precisión de la IA. El conjunto de datos de la muestra solo se aumenta en la medida necesaria para abordar las áreas de bajo rendimiento. En el ejemplo dado, los datos del espécimen se aumentarían con imágenes adicionales de gatos. Esto es más eficiente que simplemente expandir el conjunto de datos en todos sus elementos. Los nuevos datos de entrenamiento también se pueden agregar al conjunto de entrenamiento existente para proporcionar un producto completo para que un usuario final entrene su implementación.

Un método implementado por computadora para entrenar una red neuronal, comprendiendo el método: entrenar la red neuronal inicialmente con un conjunto candidato de datos de entrenamiento; ejecutar la red neuronal inicialmente entrenada contra un conjunto de datos de entrada de muestra; determinar para cada elemento del conjunto de datos de muestra un nivel de confianza en la precisión de la interpretación del elemento de datos del espécimen por parte de la red neuronal entrenada inicialmente; y si el nivel de confianza para un elemento dado está por debajo de un umbral de precisión predeterminado, entonces aumentar los datos de entrenamiento con datos relacionados con el elemento dado de el conjunto de datos de muestra y volver a entrenar la red usando los datos de entrenamiento aumentados.

La contribución

La contribución es un método de entrenamiento de una red neuronal que implica determinar mediante una red neuronal inicialmente entrenada un nivel de confianza en la precisión de la interpretación para cada elemento de un conjunto de datos de muestra, y si el nivel de confianza para un elemento dado está por debajo de un umbral, entonces aumentar los datos de entrenamiento con datos relacionados con el elemento dado y volver a entrenar la red usando los datos de entrenamiento aumentados.

La invención resuelve el problema de identificar qué datos de entrenamiento adicionales específicos se necesitan para mejorar la precisión de una red neuronal. Esto puede resultar en un método de entrenamiento más eficiente, sin embargo, no produce una red neuronal que en sí misma opere de manera más efectiva o eficiente. Ningún problema técnico ha sido resuelto dentro de la red neuronal. La identificación de los datos de entrenamiento adicionales específicos, aunque la lleva a cabo un programa informático que ejecuta una red neuronal, no es un problema técnico. Por lo tanto, la solución de ese problema no proporciona un efecto técnico.

La invención reivindicada se excluye como un programa para una computadora como tal.

Muchos dispositivos informáticos modernos, como los teléfonos inteligentes, incluyen recursos informáticos heterogéneos, como un procesador host de CPU, un procesador de gráficos (GPU) y un acelerador de red neuronal (NNA). Cada uno de estos recursos informáticos heterogéneos tiene una capacidad diferente para llevar a cabo el procesamiento necesario para realizar la función de una red neuronal. Esto significa que puede ser necesario subdividir las tareas de procesamiento de una capa de una red neuronal en porciones y asignar las porciones a los recursos informáticos heterogéneos según su capacidad respectiva, para optimizar el rendimiento de la red neuronal en el dispositivo.

Es deseable que todos los recursos informáticos terminen de procesar sus partes de la capa al mismo tiempo (o encuentro), ya que esto permite el funcionamiento eficiente de cada uno de los recursos informáticos, por ejemplo, evitando retrasos o paradas y reduciendo el tiempo de inactividad de la informática. recursos.

Para conseguir este resultado deseado, el inventor se ha dado cuenta de que se puede hacer que los recursos informáticos respectivos terminen el procesamiento respectivo de sus partes casi al mismo tiempo alterando sus frecuencias de reloj.

Un método para operar una red neuronal en un sistema de procesamiento que comprende una pluralidad de procesadores, cada procesador tiene una capacidad de computación de red neuronal diferente, el método comprende: determinar una distribución del procesamiento de una capa de la red neuronal para que cada uno de la pluralidad de los procesadores se le asigna una parte del procesamiento de la capa de acuerdo con su respectiva capacidad informática de red neuronal; determinar el tiempo que tardará cada procesador en realizar su parte del procesamiento de la capa; determinar si la frecuencia de reloj de cualquiera de los procesadores debe modificarse para cambiar el tiempo que tardará el procesador en completar su porción; distribuir las porciones a los respectivos procesadores; y en respuesta a la determinación de que debe modificarse una frecuencia de reloj para un procesador, modificar la frecuencia de reloj para ese procesador cuando procesa su porción respectiva.

La contribución

La contribución es un método para operar una red neuronal utilizando recursos informáticos heterogéneos donde la carga de procesamiento para una capa de la red neuronal se comparte entre los recursos de procesamiento, y la frecuencia de reloj de al menos un recurso de procesamiento se ajusta para alterar el tiempo en que termina su parte de procesamiento.

La contribución es más que un programa para una computadora como tal y es de carácter técnico. Esto se debe a que incluye un proceso de operar una computadora de una manera nueva en un sentido técnico relevante, por ejemplo, controlando la frecuencia de reloj de un procesador para que cada procesador heterogéneo termine la ejecución de su parte de una capa de red neuronal al mismo tiempo. . El poste indicador (iii) indica patentabilidad.

La invención definida en la reivindicación no está excluida bajo la sección 1(2).

Los modelos de aprendizaje automático, como las redes neuronales, pueden requerir que una unidad de procesamiento (como un acelerador de hardware) realice cálculos complejos.

Por ejemplo, una red neuronal puede incluir una o más capas de red neuronal convolucional para realizar cálculos de convolución usando datos de entrada. El procesamiento de estas capas generalmente involucra numerosas multiplicaciones de matrices que involucran matrices muy grandes de datos de entrada. Estos tipos de cálculos son computacionalmente costosos de realizar utilizando las unidades de procesamiento existentes.

Además, la naturaleza de ciertos algoritmos de aprendizaje automático significa que una gran fracción de los datos de entrada para una capa determinada de una red neuronal tienen valores que son cero. Esto significa que las unidades de procesamiento existentes realizan una gran cantidad de cálculos innecesarios que incluyen la multiplicación de un número (por ejemplo, un valor de núcleo de convolución) por un valor cero.

El inventor ha ideado una unidad de procesamiento que puede omitir o eludir un cálculo al ver valores de entrada cero, lo que tiene la ventaja de hacer que la unidad de procesamiento sea más eficiente desde el punto de vista computacional en comparación con las unidades de procesamiento conocidas.

Un conjunto de valores de datos para ser procesados ​​por una capa de red neuronal determinada se recibe y almacena en una memoria de la unidad de procesamiento. La unidad de procesamiento tiene una unidad de control que verifica los datos de entrada para valores cero y distintos de cero. La unidad de control genera un índice de direcciones que identifica solo las direcciones de memoria de la memoria que almacena valores de datos de entrada distintos de cero.

La unidad de control utiliza el índice de direcciones para seleccionar direcciones de memoria que almacenan valores de datos de entrada distintos de cero y proporciona los valores de datos de entrada distintos de cero en un bus de datos para que puedan ser procesados ​​por una matriz de elementos de procesamiento.

Un método implementado por computadora para realizar cálculos para una red neuronal que tiene una pluralidad de capas, el método es realizado por una unidad de procesamiento que tiene una memoria, un bus de datos, una unidad de control y una matriz de elementos de procesamiento, el método comprende recibir, por parte del unidad de procesamiento, una pluralidad de valores de datos de entrada para ser procesados ​​por una capa de la pluralidad de capas; determinar, mediante la unidad de control, si cada uno de los valores de datos de entrada tiene un valor cero o distinto de cero; almacenar la pluralidad de valores de datos de entrada en la memoria; generación, por parte de la unidad de control, de un índice de dirección que identifica solo ubicaciones de direcciones de memoria en la memoria que almacenan valores de datos de entrada distintos de cero; y proporcionar, por parte de la unidad de control, en base a las ubicaciones de dirección de memoria identificadas por el índice de dirección, los valores de datos de entrada distintos de cero desde la memoria a través del bus de datos a la matriz de elementos de procesamiento.

La contribución

La contribución se relaciona con la realización de cálculos de aprendizaje automático en una unidad de procesamiento que tiene una unidad de control que determina si los valores de datos de entrada recibidos para ser procesados ​​por una capa de red neuronal tienen valores cero o distintos de cero, genera un índice de dirección que identifica direcciones de memoria en las que no -Se almacenan valores de datos de entrada cero, y eso utiliza el índice de dirección para proporcionar valores de datos de entrada distintos de cero a una matriz de elementos de procesamiento.

Aunque la contribución se limita al rendimiento de los cálculos de aprendizaje automático requeridos por una capa determinada de una red neuronal, la contribución implica la generación de un índice de dirección que se usa de manera efectiva para controlar la matriz de elementos de procesamiento, de modo que solo procesan entradas distintas de cero. valores de datos almacenados en la memoria. Este es un ejemplo de operar una computadora de una manera nueva en un sentido técnico de acuerdo con la señal (iii). La contribución es una solución técnica al problema de mejorar la eficiencia computacional de las unidades de procesamiento existentes de acuerdo con el poste indicador (v). La invención es más que un programa para una computadora como tal.

La invención no está excluida bajo la sección 1(2).

Es bien conocido el uso de computación distribuida para tareas de aprendizaje automático. Por ejemplo, cuando se entrena iterativamente una red neuronal, un conjunto de datos de entrenamiento puede subdividirse y compartirse entre los nodos de procesamiento de un sistema informático distribuido. Luego, cada nodo puede procesar sus datos de entrenamiento para producir un resultado de entrenamiento parcial respectivo, por ejemplo, la cantidad en la que se deben ajustar uno o más pesos en una red neuronal. Estos resultados parciales luego se reducen (es decir, se procesan con una función informática) para producir un resultado completo que se transmite a los nodos para actualizar el modelo de aprendizaje automático en cada nodo antes de que ocurra el siguiente paso de entrenamiento.

Se han ideado varias topologías existentes (p. ej., anillo, toro) y métodos de intercambio de datos (p. ej., métodos de reducción total y de recopilación total) para optimizar la eficiencia de los sistemas informáticos distribuidos al procesar cargas de trabajo como las que se encuentran en el aprendizaje automático. El inventor ha ideado una nueva topología y un método de intercambio que puede procesar tareas de aprendizaje automático con mayor eficiencia.

La topología se muestra en la figura anterior. Los nodos de procesamiento (p. ej., P0A-P3B) se organizan en grupos. Cada nodo de un grupo está conectado con cada uno de los demás nodos del grupo mediante un primer y un segundo enlace de comunicación. Los grupos están interconectados en anillos de manera que cada nodo es miembro de un solo grupo y un solo anillo.

El método de intercambio de datos utilizado por la topología funciona de forma iterativa. Cada nodo de un grupo intercambia dos elementos de datos de una matriz de elementos de datos con los otros nodos de su grupo, a través de los respectivos enlaces primero y segundo. Luego, cada nodo de procesamiento reduce cada elemento de datos recibido con un elemento de datos que se encuentra en una posición correspondiente en su matriz de datos almacenados a través de un proceso de compartir y combinar secuencialmente los elementos de datos.

Un método de operación de una computadora que comprende nodos de procesador dispuestos en grupos y anillos, de modo que todos los nodos de un solo grupo están conectados entre sí mediante un primer y un segundo enlace, y los grupos están interconectados en anillos de modo que cada nodo está en un solo grupo y un solo anillo, comprendiendo el método: operar un colectivo de aprendizaje automático donde cada nodo del procesador procesa datos de entrada para generar una matriz de elementos de datos de salida; intercambiar elementos de datos usando pasos de intercambio del colectivo de aprendizaje automático; y donde en cada paso de intercambio los nodos de procesamiento de todos los grupos intercambian, a través de los respectivos enlaces primero y segundo, dos elementos de datos con los otros nodos de su grupo, y donde todos los nodos de procesamiento reducen cada elemento de datos recibido con el elemento de datos en la posición correspondiente en la matriz en ese nodo de procesamiento.

La contribución

La contribución es un método de aprendizaje automático que utiliza una nueva topología y un método de intercambio de datos que optimiza el rendimiento de la tarea de aprendizaje automático en un sistema informático distribuido a través de la interconexión de los nodos y la forma de intercambio de datos.

La contribución no es únicamente un programa como tal porque, además de ser un método de aprendizaje automático, se trata de una nueva topología informática y método de intercambio de datos. Este es un ejemplo de una nueva disposición de hardware que opera un sistema informático de una manera nueva, en un sentido técnico relevante. Una contribución técnica se revela siguiendo la señal (iii). La contribución es una solución técnica al problema abordado por la invención, a saber, cómo organizar un sistema informático distribuido para realizar de manera eficiente tareas colectivas de aprendizaje automático aunque esté incorporado como un programa. La señal (v) también apunta a la patentabilidad.

La invención no está excluida bajo la sección 1(2).

La contribución La contribución La contribución La contribución La contribución La contribución La contribución La contribución La contribución La contribución La contribución La contribución La contribución La contribución La contribución La contribución La contribución