Crypto Currency

La infraestructura de datos centralizada viola el núcleo de descentralización de Web3

xxtac7 months ago08 mins

Opinión de: Michael O’Rourke, fundador de Pocket Network y CEO de Grove

Open Data es actualmente un importante contribuyente para construir una economía tecnológica emergente global, con un mercado estimado de más de $ 350 mil millones. Sin embargo, las fuentes de datos abiertas a menudo dependen de la infraestructura centralizada, al contrario de la filosofía de la autonomía y la resistencia a la censura.

Para realizar su potencial, los datos abiertos deben cambiar a infraestructura descentralizada. Una vez que los canales de datos abiertos comienzan a usar una infraestructura descentralizada y abierta, se resolverán múltiples vulnerabilidades para aplicaciones de usuario.

La infraestructura abierta tiene muchos casos de uso, desde alojamiento de una aplicación descentralizada (DAPP) o un bot de negociación hasta compartir datos de investigación hasta capacitación e inferencia de modelos de idiomas grandes (LLM). Mirar de cerca a cada uno nos ayuda a comprender mejor por qué aprovechar la infraestructura descentralizada para datos abiertos es más utilitario que la infraestructura centralizada.

Entrenamiento e inferencia de LLM asequibles

El lanzamiento de la AI Deepseek de código abierto, que eliminó $ 1 billón de los mercados tecnológicos de EE. UU., Demuestra el poder de los protocolos de código abierto. Es una llamada de atención para centrarse en la economía del Nuevo Mundo de los datos abiertos.

Para empezar, los modelos de IA centralizados y de código cerrado tienen altos costos para capacitar a LLM y generar resultados precisos.

Como era de esperar, la etapa final de entrenamiento Deepseek R1 cuesta aproximadamente $ 5.5 millones, en comparación con más de $ 100 millones para el GPT-4 de OpenAI. Sin embargo, la industria emergente de IA todavía se basa en plataformas de infraestructura centralizadas como los proveedores de API de LLM, que están esencialmente en desacuerdo con las innovaciones emergentes de código abierto.

Organizar LLMS de código abierto como Llama 2 y Deepseek R1 es simple y económico. A diferencia de las cadenas de bloques con estado que requieren sincronización constante, los LLM son apátridas y solo necesitan actualizaciones periódicas.

Reciente: HEra por qué Deepseek estrelló tu bitcoin y cripto

A pesar de la simplicidad, los costos computacionales de ejecutar inferencia en modelos de código abierto son altos, ya que los corredores de nodos necesitan GPU. Estos modelos pueden ahorrar costos, ya que no requieren actualizaciones en tiempo real para sincronizar continuamente.

El aumento de modelos base generalizables como GPT-4 ha permitido el desarrollo de nuevos productos a través de la inferencia contextual. Empresas centralizadas como OpenAI no permitirán ningún soporte o inferencia de red aleatoria de su modelo capacitado.

Por el contrario, los corredores de nodos descentralizados pueden apoyar el desarrollo de LLM de código abierto al servir como puntos finales de IA para proporcionar datos deterministas a los clientes. Las redes descentralizadas bajan las barreras de entrada al empoderar a los operadores para lanzar su puerta de enlace en la parte superior de la red.

Estos protocolos de infraestructura descentralizados cumplen millones de solicitudes en sus redes sin permisos mediante la obtención de la puerta de enlace y la infraestructura de servicio. En consecuencia, cualquier emprendedor u operador puede desplegar su puerta de enlace y aprovechar un mercado emergente.

Por ejemplo, alguien puede capacitar a un LLM con recursos informáticos descentralizados en el protocolo sin permiso Akash, que permite servicios informáticos personalizados a precios 85% más bajos que los proveedores de nubes centralizados.

El mercado de capacitación e inferencia de IA tiene un potencial inmenso. Las compañías de IA gastan aproximadamente $ 1 millón diarias en mantenimiento de infraestructura para ejecutar la inferencia de LLM. Esto lleva al mercado el mercado obtenible, o Sam, a aproximadamente $ 365 millones anuales.

Como sugieren los datos, las condiciones del mercado indican un potencial de crecimiento masivo para la infraestructura descentralizada.

Intercambio de datos de investigación accesible

En el dominio científico e de investigación, el intercambio de datos combinado con el aprendizaje automático y las LLM pueden acelerar la investigación y mejorar la vida humana. El acceso a esos datos ha sido amurallado por el sistema de revistas de alto costo, que publica selectivamente la investigación que su junta aprueba y es ampliamente inaccesible detrás de suscripciones costosas.

Con el aumento de los modelos ML de conocimiento cero basados en blockchain, los datos ahora se pueden compartir y calcularse sin confianza, y la privacidad se puede preservar sin revelar datos confidenciales. Por lo tanto, los investigadores y los científicos pueden compartir y acceder a los datos de investigación sin desanonimizar la información potencialmente restringida de identificación personal.

Para compartir de manera sostenible los datos de investigación abiertos, los investigadores necesitan acceso a una infraestructura descentralizada que los recompensa por el acceso a esos datos, eliminando al intermediario. Una red de datos abiertos incentivados puede garantizar que los datos científicos sigan siendo accesibles fuera del jardín amurallado de revistas costosas y corporaciones privadas.

Alojamiento DAPP imparable

Las plataformas de alojamiento de datos centralizadas como Amazon Web Services, Google Cloud y Microsoft Azure son populares entre los desarrolladores de aplicaciones. A pesar de su fácil accesibilidad, las plataformas centralizadas sufren de un solo punto de falla, afectando la confiabilidad y conduciendo a interrupciones raras pero plausibles.

Hay varias instancias en la historia de la tecnología cuando las plataformas de infraestructura como servicio no han podido proporcionar servicios ininterrumpidos.

Por ejemplo, en 2022, Metamask negó temporalmente el acceso a usuarios de regiones geográficas específicas porque Infura los bloqueó después de algunas sanciones en los Estados Unidos. Aunque Metamask está descentralizado, sus conexiones y puntos finales predeterminados dependen de la tecnología centralizada como Infura para acceder a Ethereum.

Este tampoco fue un incidente aislado. Los clientes de Infura también enfrentaron una interrupción en 2020, mientras que Solana y Polygon experimentaron una sobrecarga de llamadas de procedimientos remotos centralizados (RPC) durante el tráfico máximo.

Es difícil para una empresa manejar diversas necesidades de desarrolladores en un próspero ecosistema de código abierto. Hay miles de capas 1s, rollups, indexación, almacenamiento y otros protocolos de middleware con casos de uso de nicho.

La mayoría de las plataformas centralizadas, como los proveedores de RPC, siguen construyendo la misma infraestructura, lo que crea fricción, ralentiza las métricas de crecimiento y afecta la escalabilidad porque los protocolos se centran en la reconstrucción de la base en lugar de agregar nuevas características.

Por el contrario, el éxito masivo de aplicaciones de redes sociales descentralizadas como Bluesky y en Protocol señala la búsqueda de los usuarios de protocolos descentralizados. Pasando más allá de los RPC centralizados para acceder a datos abiertos, tales protocolos nos recuerdan la necesidad de construir y trabajar en infraestructura descentralizada.

Por ejemplo, un protocolo financiero descentralizado puede obtener datos de precios de la cadena de la cadena para detener dependiendo de las API centralizadas para los alimentos de precios y los datos del mercado en tiempo real.

Hay aproximadamente 100 mil millones de solicitudes de RPC útiles en el mercado Web3, que cuesta $ 3 a $ 6 por millón de solicitudes. Por lo tanto, el tamaño total del mercado direccionable de Web3 RPC es de $ 100 millones, $ 200 millones anuales. Con el crecimiento constante de nuevas capas de disponibilidad de datos, puede haber más de 1 billón de solicitudes de RPC diariamente.

Es imperativo pivotar hacia la infraestructura descentralizada para mantenerse sincronizado con transferencias de datos abiertos y aprovechar el mercado de datos de código abierto.

Los datos abiertos requieren infraestructura descentralizada

Veremos a los clientes de blockchain generalizados que descargan almacenamiento y redes a protocolos de middleware especializados a largo plazo.

Por ejemplo, Solana lideró el movimiento de descentralización cuando comenzó a almacenar sus datos en cadenas como Arweave. No es de extrañar que Solana y Phantom volvieran una vez más las principales herramientas para manejar el tráfico masivo de Memecoin Presidency Memecoin, un momento clave en la historia financiera y cultural.

En el futuro, veremos más flujo de datos a través de protocolos de infraestructura, creando dependencias en las plataformas de middleware. A medida que los protocolos se vuelven más modulares y escalables, hará espacio para que el middleware descentralizado de código abierto se integre a nivel de protocolo.

Es inviable que las empresas centralizadas funcionen como intermediarios para encabezados de clientes ligeros.

La infraestructura descentralizada es confiable, distribuida, rentable y resistente a la censura. Como resultado, la infraestructura descentralizada será la opción predeterminada para los desarrolladores de aplicaciones y las empresas por igual, lo que lleva a una narración de crecimiento mutuamente beneficiosa.

Opinión de: Michael O’Rourke, fundador de Pocket Network y CEO de Grove.

Este artículo es para fines de información general y no está destinado a ser y no debe tomarse como asesoramiento legal o de inversión. Los puntos de vista, los pensamientos y las opiniones expresadas aquí están solos del autor y no reflejan ni representan necesariamente las opiniones y opiniones de Cointelegraph.