Todo lo que necesitas saber sobre las redes neuronales artificiales

Entre las tecnologías más predominantes de la última década son las redes neuronales artificiales, la parte primordial de los algoritmos de estudio profundo, la vanguardia de la IA (inteligencia artificial).

Puedes agradecer a las redes neuronales muchas de las apps que empleas todos los días, como el servicio de traducción de Google plus, la cerradura del iPhone de Apple Face ID y el asistente de Amazon para la inteligencia artificial Alexa. Las redes neuronales además están tras varios de los indispensables adelantos de la IA (inteligencia artificial) en otros campos, como el diagnóstico de cáncer de piel y de mama, y ofrecer ojos a los turismos que se conducen solos.

El criterio y la ciencia tras las redes neuronales artificiales han existido a lo largo de muchas décadas. Mas solo en los últimos tiempos las promesas de las redes neuronales se convirtieron de todos modos y han ayudado a la industria de la inteligencia artificial a salir de un film invierno.

En tanto que las redes neuronales han ayudado a la inteligencia artificial a ofrecer enormes saltos, además son comunmente incomprendidas. Aquí está todo lo que es necesario para ti entender sobre las redes neuronales.

Las semejanzas entre las redes neuronales artificiales y las biológicas

La visión original de los vanguardistas de la IA (inteligencia artificial) era replicar las funcionalidades del cerebro humano, la creación popular más capaz y complicada de la naturaleza. De ahí que el campo ha derivado una gran parte de su nomenclatura (introduciendo el término «IA (inteligencia artificial)») del físico y las funcionalidades de la cabeza humana.

Las redes neuronales artificiales se inspiran en sus análogos biológicos. Muchas de las funcionalidades del cerebro prosiguen siendo un secreto, mas lo que entendemos es que las redes neuronales biológicas aceptan al cerebro procesar gigantes proporciones de información de formas complejas.

La red neuronal biológica del cerebro radica en precisamente 100.000 millones de neuronas, la unidad básica de procesamiento del cerebro. Las neuronas hacen sus funcionalidades por medio de sus masivas conexiones entre sí, llamadas sinapsis. El cerebro humano tiene precisamente 100 trillones de sinapsis, cerca de 1.000 por neurona.

Cada función del cerebro supone corrientes eléctricas y reacciones químicas que corren mediante un elevado número de estas neuronas.

Cómo trabajan las redes neuronales artificiales

 

Redes_neuronales_esquema

 

El ingrediente central de las RNA son las neuronas artificiales. Cada neurona recibe entradas de numerosas otras neuronas, las multiplica por los pesos asignados, las suma y pasa la suma a una o bien más neuronas. Ciertas neuronas artificiales tienen la posibilidad de utilizar una función de activación al salir antes de pasarla a la próxima variable.

En el fondo, esto podría parecer una operación matemática muy trivial. Mas en el momento en que se ponen cientos, miles y millones de neuronas en múltiples capas y se amontonan unas sobre otras, se consigue una red neuronal artificial que puede hacer tareas muy complejas, como clasificar imágenes o bien admitir el charla.

Las redes neuronales artificiales están compuestas por una cubierta de entrada, que recibe datos de fuentes ajenas (ficheros de datos, imágenes, sensores de hardware, micrófono…), una o bien más capas escondes que procesan los datos, y una cubierta de salida que brinda uno o bien más puntos de datos basados en la función de la red. Entre otras cosas, una red neuronal que descubre personas, turismos y animales va a tener una cubierta de salida con tres nodos. Una red que clasifique las transferencias bancarias entre seguras y fraudulentas va a tener una única salida.

Entrenamiento de redes neuronales artificiales

 

 

Las redes neuronales artificiales empiezan asignando valores al azar a los pesos de las conexiones entre neuronas. La clave a fin de que la RNA haga su labor con corrección y precisa es cambiar estos pesos a los números adecuados. Mas hallar los pesos adecuados no es muy fácil, fundamentalmente tratándose de múltiples capas y una cantidad enorme de neuronas.

Esta calibración se hace «adiestrando» a la red con ejemplos anotados. Entre otras cosas, si deseas entrenar el clasificador de imágenes citado previamente, le proporcionas múltiples imágenes, cada una etiquetada con su correspondiente clase (persona, coche o bien animal). Mientras se le ofrecen cada vez más ejemplos de entrenamiento, la red neuronal ajusta gradualmente sus pesos para conceder cada entrada a las salidas adecuadas.

Esencialmente, lo que ocurre a lo largo del entrenamiento es que la red se ajusta a sí para agarrar patrones concretos de los datos. Otra vez, en la situacion de una red de clasificadores de imágenes, en el momento en que se adiestra el modelo de inteligencia artificial con ejemplos de calidad, cada cubierta descubre una clase concreta de peculiaridades. Entre otras cosas, la primera cubierta puede descubrir bordes horizontales y verticales, las próximas capas tienen la posibilidad de ubicar esquinas y formas redondas. Más abajo en internet, las capas más profundas empezarán a ubicar peculiaridades más destacadas como caras y elementos.

En el momento en que se ejecuta una exclusiva imagen mediante una red neuronal bien entrenada, los pesos ajustados de las neuronas van a ser capaces de obtener las peculiaridades adecuadas y saber con precisión a qué clase de salida forma parte la imagen.

Entre los desafíos de entrenar las redes neuronales es hallar la cantidad y calidad correctas de ejemplos de entrenamiento. Además, el entrenamiento de enormes modelos de inteligencia artificial necesita enormes proporciones de elementos informáticos. Para sobrepasar este desafío, varios ingenieros usan el «estudio por transferencia», una técnica de entrenamiento donde se toma un modelo preentrenado y se lo ajusta con nuevos ejemplos concretos del dominio. La educación por transferencia es principalmente eficiente en el momento en que ahora hay un modelo de inteligencia artificial que se aproxima a su caso de empleo.

Las redes neuronales en frente de la inteligencia artificial tradicional

Los programas habituales de inteligencia artificial basados en reglas se fundamentaban en los principios del programa tradicional. Los programas informáticos están diseñados para realizar operaciones con datos guardados en sitios de memoria, y almacenar los desenlaces en un espacio de memoria diferente. La lógica del programa es secuencial, determinista y fundamentada en reglas precisamente establecidas. Las operaciones son ejecutadas por uno o bien más procesadores centrales.

Las redes neuronales, no obstante, no son ni secuenciales ni deterministas. Además, con independencia del hardware subyacente, no hay un procesador central que controle la lógica. En su sitio, la lógica se desperdigada mediante los una cantidad enorme de neuronas artificiales más pequeñas. Las RNA no ejecutan normas, sino hacen operaciones matemáticas en sus entradas. Son sus operaciones colectivas las que desarrollan el accionar del modelo.

En vez de representar el saber mediante la lógica codificada de forma manual, las redes neuronales codifican su conocimiento en el estado general de sus pesos y activaciones. El jefe de la inteligencia artificial de Tesla, Andrej Karpathy, detalla elocuentemente la lógica de programa de las redes neuronales en un increíble articulo de Medium que se titula «Programa 2.0»:

La «pila tradicional» del Programa 1.0 es con lo que todos nos encontramos familiarizados – está escrito en idiomas como Python, C++, etc. Radica en normas explícitas para el PC escritas por un programador. Al redactar cada línea de código, el programador identifica un punto concreto en el espacio del programa con algún accionar deseable.

En contraste, el Programa 2.0 puede ser escrito en un lenguaje considerablemente más abstracto y poco accesible para los humanos, como los pesos de una red neuronal. Ningún humano está implicado en la escritura de este código porque existen muchos pesos (las redes habituales tienen la posibilidad de tener millones), y codificar de manera directa en pesos es algo bien difícil (lo procuré).

Redes neuronales vs. otras técnicas de estudio automático

Las redes neuronales artificiales son solo entre los numerosos algoritmos para hacer la educación de la máquina, la rama de la IA (inteligencia artificial) que lleva a cabo el accionar apoyado en la vivencia. Existen muchas otras técnicas de estudio de máquinas que tienen la posibilidad de hallar patrones en los datos y hacer tareas como la clasificación y la predicción. Ciertas de estas técnicas tienen dentro modelos de regresión, máquinas de vectores de acompañamiento (SVM), métodos de k-nearest y árboles de resolución.

Por otro lado, tratándose de conducir datos desorganizados y no estructurados como imágenes, audio y texto, las redes neuronales sobrepasan a otras técnicas de estudio automático.

Entre otras cosas, si se les encantaría hacer tareas de clasificación de imágenes con los algoritmos tradicionales de estudio automático, habría que llevar a cabo mucha «ingeniería de peculiaridades» complicada, un desarrollo difícil y duro que requeriría el ahínco de numerosos ingenieros y profesionales en el tema. Las redes neuronales y los algoritmos de estudio profundo no necesitan ingeniería de peculiaridades y extraen de forma automática peculiaridades de las imágenes si están bien entrenados.

Por otro lado, esto no supone que la red neuronal sea un sustituto de otras técnicas de estudio automático. Otros géneros de algoritmos necesitan menos elementos de computación y son menos complicados, lo que los hace preferibles tratándose de solucionar un inconveniente que no necesita redes neuronales.

Otras técnicas de estudio automático además son interpretables (más sobre esto ahora), lo que supone que es más fácil investigar y corregir las elecciones que toman. Esto podría hacerlas preferibles en casos de empleo en los que la interpretabilidad es más esencial que la precisión.

Los límites de las redes neuronales

Más allá de su nombre, las redes neuronales artificiales son muy dispares de su semejante humano. Y aunque las redes neuronales y la educación profundo son el estado del arte de la inteligencia artificial hoy en día, todavía están lejísimos de el intelecto humana.

Entonces, las redes neuronales fallarán en varias cosas que se aguardaría de una cabeza humana:

Las redes neuronales requieren varios datos: En contraste al cerebro humano, que puede estudiar a llevar a cabo cosas con escasos ejemplos, las redes neuronales requieren miles y millones de ejemplos.
Las redes neuronales son malas para generalizar: Una red neuronal se desempeñará con precisión en una labor para la que fué entrenada, mas muy mal en otra cosa, inclusive si es semejante al inconveniente original. Entre otras cosas, un clasificador de gatos entrenado en cientos de imágenes de gatos no será con la capacidad de descubrir a los perros. Para eso, precisará cientos de novedosas imágenes. En contraste con los humanos, las redes neuronales no desarrollan el saber en concepto de símbolos (orejas, ojos, bigotes, cola), sino procesan los valores de los pixeles. De ahí que no van a poder estudiar sobre nuevos elementos en concepto de peculiaridades de prominente nivel y requieren ser reentrenados desde el princípio.
Las redes neuronales son opacas: Ya que las redes neuronales manifiestan su accionar en concepto de pesos y activaciones de neuronas, es realmente difícil saber la lógica tras sus elecciones. De ahí que comunmente se describen como cajas negras. Esto provoca que sea bien difícil saber si están tomando elecciones fundamentadas en los causantes equivocados.

Deja un comentario

Cerrar menú