Spain Brazil Russia France Germany China Korea Japan

Artificial Intelligence driven Marketing Communications

 
May 31, 2018 5:01 AM ET

Dispositivo permite a un ordenador personal procesar gráficos enormes. Con novedoso sistema, los científicos de datos pueden analizar redes masivas sin la necesidad de potentes servidores.


Dispositivo permite a un ordenador personal procesar gráficos enormes. Con novedoso sistema, los científicos de datos pueden analizar redes masivas sin la necesidad de potentes servidores.

iCrowd Newswire - May 31, 2018

Researchers from MIT’s Computer Science and Artificial Intelligence Laboratory (CSAIL) have designed a device that helps cheap flash storage process massive graphs on a personal computer. The device (pictured here) consists of a flash chip array (eight black chips) and computation “accelerator

En el lenguaje de la ciencia de los datos, los gráficos son estructuras de nodos y líneas de conexión que se utilizan para asignar puntuaciones de relaciones de datos complejas. Análisis de gráficas es útil para una amplia gama de aplicaciones, como el ranking de las páginas web, análisis de redes sociales por ideas políticas, o trazar las estructuras de la neurona en el cerebro.

Consisten en miles de millones de nodos y líneas, sin embargo, grandes gráficos pueden llegar a terabytes de tamaño. Los datos del gráfico se procesan normalmente en memoria caro acceso al azar dinámica (COPITA) en múltiples servidores de hambrientos de poder.

Investigadores de Ciencias de la computación y el laboratorio de Inteligencia Artificial (CSAIL) del MIT han diseñado un dispositivo que utiliza almacenamiento flash barata, del tipo usado en los teléfonos inteligentes — para procesar gráficos masivos utilizando sólo un ordenador personal individual.

Almacenamiento flash es típicamente mucho más lento que copita en el tratamiento de los datos del gráfico. Pero los investigadores desarrollaron un dispositivo que consiste en un chip flash matriz y cómputo “acelerador,” que ayuda a flash logra DRAM-como funcionamiento.

Accionar el dispositivo es un nuevo algoritmo que clasifica todas las solicitudes de acceso de datos de gráfico en un orden secuencial que flash puede acceder rápida y fácilmente. También fusiona algunas peticiones para reducir la sobrecarga, el tiempo de cálculo combinado, memoria, ancho de banda y otros recursos informáticos, de la clasificación.

Los investigadores funcionaron el dispositivo contra varios sistemas tradicionales de alto rendimiento procesamiento varios gráficos grandes, incluyendo el masivo Web datos Commons enlace gráfico, que tiene 3,5 billones de nodos y líneas de conexión 128 billones. Para procesar ese gráfico, los sistemas tradicionales de todos requieren un servidor que cuestan miles de dólares y contenía 128 gigabytes de memoria DRAM. Los investigadores lograr el mismo rendimiento al conectar dos de sus dispositivos, por un total de 1 gigabyte de memoria DRAM y 1 terabyte de flash — en una computadora de escritorio. Por otra parte, mediante la combinación de varios dispositivos, podrían procesar gráficos masivos — nodos hasta 4 billones y 128 billones líneas de conexión — que ningún otro sistema podía manejar en el servidor de 128 gigabytes.

“La conclusión es que podemos mantener rendimiento con menos mucho menores y refrigerador, como en temperatura y consumo de energía, máquinas,” dice Sang-Woo Jun, un estudiante graduado de CSAIL y primer autor de un artículo que describe el dispositivo, que se presenta en el Simposio Internacional sobre arquitectura de computadores (ISCA).

El dispositivo podría usarse para cortar costes y energía asociada de análisis gráfico e incluso mejorar el rendimiento, en una amplia gama de aplicaciones. Los investigadores, por ejemplo, en la actualidad están creando un programa que podría identificar los genes que causan cáncer. Empresas de tecnología más importantes como Google también podrían aprovechar los dispositivos para reducir su huella de la energía usando las máquinas mucho menos para ejecutar el análisis.

“Procesamiento gráfico es una idea tan general,” dice Arvind coautor, el profesor Johnson en Ingeniería Informática. » ¿Qué graduación de la página tiene en común con la detección del gen? Para nosotros, es el mismo problema de cómputo, gráficos a diferentes con significados diferentes. El tipo de aplicación que alguien desarrolla determinará el impacto que tiene en la sociedad.”

Papel de coautores es egresado CSAIL Shuotao Xu y Andy Wright y Sizhuo Zhang, dos estudiantes graduados en CSAIL, Departamento de ingeniería eléctrica y Ciencias de la computación.

Ordenar y reducir

En análisis gráfico, un sistema básicamente buscar y actualizar el valor de un nodo en función de sus conexiones con otros nodos, entre otros indicadores. En el ranking de la página web, por ejemplo, cada nodo representa una página web. Si el nodo A tiene un alto valor y se conecta al nodo B, entonces valor de nodo B también aumentará.

Sistemas tradicionales de almacenan todos los datos de gráfico en DRAM, que las hace rápido en procesar los datos pero también caros y potentes. Algunos sistemas de descarga de algún almacenamiento de datos para flash, que es más barato pero más lento y menos eficiente, por lo que todavía requieren cantidades sustanciales de DRAM.

Dispositivo de los investigadores se ejecuta en lo que los investigadores llaman un algoritmo “reducir en especie”, que soluciona un grave problema con el uso de flash como la fuente de almacenamiento de información primario: residuos.

Sistemas de análisis gráfico requieren acceso a los nodos que pueden estar muy lejos de uno a otro a través de una estructura gráfica masiva, dispersa. Sistemas generalmente solicitar acceso directo a, digamos, 4 a 8 bytes de datos para actualizar el valor de un nodo. DRAM proporciona ese acceso directo muy rápidamente. Flash, sin embargo, sólo tiene acceso a datos en trozos de 4 a 8 kilobytes, pero actualiza sólo unos pocos bytes. Repitiendo que el acceso para todas las solicitudes mientras que saltar a través de la gráfica desperdicia ancho de banda. “Si usted necesita acceder el enteros 8 kilobytes y usar sólo 8 bytes y tirar el resto, terminan lanzando rendimiento 1.000 veces,” dice Jun.

El reducir la clase algoritmo toma todas las solicitudes de acceso directo en su lugar y ordena en orden secuencial por identificadores, que muestran el destino de la solicitud, como agrupar todas las actualizaciones para el nodo A, todo para el nodo B y así sucesivamente. Flash puede acceder a trozos de tamaño en kilobytes de miles de peticiones a la vez, lo que es mucho más eficiente.

Para ahorrar aún más ancho de banda y potencia de cómputo, el algoritmo combina simultáneamente los datos en las agrupaciones más pequeño posible. Cuando las notas del algoritmo que empareja identificadores, sumas los en un paquete de datos solo — como A1 y A2 en A3. Sigue haciendo, creando cada vez más más pequeños paquetes de datos con identificadores, a juego hasta que produzca el paquete más pequeño posible para ordenar. Esto reduce drásticamente la cantidad de solicitudes duplicadas para acceder.

Usando el algoritmo en dos gráficos grandes tipo-reducir, los investigadores redujeron el total de datos que necesitan ser actualizados en flash por cerca del 90 por ciento.

Descarga de cómputo

El reducir la clase algoritmo es computación intensiva para un equipo host, sin embargo, así que los investigadores implementado un acelerador personalizado en el dispositivo. El acelerador actúa como un punto medio entre el host y los chips flashes, todo cálculo para el algoritmo de ejecución. Esto reduce la carga de tanto poder el acelerador que el host puede ser un PC o portátil que maneja datos ordenados y ejecuta otras tareas menores baja potencia.

“Aceleradores se suponen para ayudar a que el host de computar, pero hemos llegado hasta ahora [con los cómputos] que la hostia se convierte en importante,” dice Arvind.

“El trabajo MIT muestra una nueva forma de realizar análisis en gráficos muy grandes: su trabajo aprovecha la memoria flash para almacenar los gráficos y explota ‘arreglos de compuertas programables en campo’ [los circuitos integrados personalizados] en una manera ingeniosa de realizar el análisis y los datos proceso necesario para utilizar memoria flash con eficacia,”dice Keshav Pingali, profesor de Ciencias de la computación en la Universidad de Texas en Austin. “A la larga, esto puede llevar a los sistemas que pueden procesar grandes cantidades de datos eficientemente en laptops o computadoras de escritorio, que va a revolucionar cómo hacemos grande informática”.

Porque el host puede ser tan baja potencia, Jun dice: un objetivo a largo plazo es crear una biblioteca de plataforma y software de uso general para los consumidores a desarrollar sus propios algoritmos para aplicaciones más allá de análisis gráfico. “Usted podría enchufe esta plataforma en un ordenador portátil, descargar [software] y escribir programas simples para obtener rendimiento del servidor en su ordenador portátil,” dice.

See Campaign: http://news.mit.edu/2018/device-allows-personal-computer-process-huge-graphs-0531
Contact Information:
Rob Matheson

Tags:
, Wire, Artificial Intelligence Newswire, United States, Spanish

image




iCrowdNewswire

Tags:    News