Qué es WebRTC: cómo funciona y sus aplicaciones clave
En España hay más de 3,2 millones de teletrabajadores (INE/InfoJobs 2025) y un 78 % de las empresas con 250 o más empleados ofrece alguna modalidad de trabajo a distancia (Encuesta TIC del INE, 2025). Detrás de las herramientas de comunicación que esa gente usa a diario hay, casi siempre, la misma tecnología: WebRTC.
WebRTC, o Web Real-Time Communication, hace posible la comunicación directa de vídeo, audio y datos en el navegador, sin plugins ni instalaciones, y con privacidad integrada en la arquitectura. Es la base sobre la que funcionan desde videollamadas de equipo hasta plataformas de telemedicina o streaming en directo.
En este artículo verás qué es WebRTC, cómo funciona por dentro y dónde se aplica.
Índice
- ¿Qué es WebRTC?
- ¿Cómo funciona WebRTC?
- ¿Para qué se usa WebRTC?
- Ventajas e inconvenientes de WebRTC
- Digital Samba y WebRTC en la práctica
¿Qué es WebRTC?
Web Real-Time Communication (WebRTC) es una tecnología de código abierto que permite la comunicación en tiempo real directamente en los navegadores web y aplicaciones móviles. Con ella, los usuarios pueden intercambiar vídeo, audio y datos en el navegador sin necesidad de plugins ni instalaciones externas.
Su historia arranca en 2010-2011, cuando Google adquirió Global IP Solutions (GIPS), cuya tecnología de codificación de audio y cancelación de eco forma el núcleo del stack de sonido, y On2 Technologies, que aportó el códec de vídeo VP8. Google abrió el código bajo licencia BSD y lo contribuyó al W3C y al IETF para su estandarización. Desde enero de 2021, WebRTC es un estándar oficial del W3C: ya no es un proyecto de Google, sino un estándar abierto gobernado por los organismos de la web.
Lo que distingue a WebRTC de otros métodos de comunicación online es su modelo peer-to-peer (P2P). En lugar de enrutar todo el tráfico a través de un servidor intermediario, WebRTC transfiere los datos directamente entre los navegadores de los participantes. Eso reduce la latencia y mejora la calidad de la transmisión.
Para que funcione, WebRTC integra tres APIs de JavaScript: getUserMedia, que accede a la cámara y el micrófono; RTCPeerConnection, que gestiona la conexión directa entre peers; y RTCDataChannel, que permite transferir datos arbitrarios entre ellos.
¿Cómo funciona WebRTC?
Vamos a desgranarlo. WebRTC emplea tres componentes principales para establecer conexiones en tiempo real entre navegadores o dispositivos.
RTCPeerConnection
RTCPeerConnection es el componente central de la API. Se encarga de establecer y mantener la comunicación P2P entre navegadores: intercambia audio, vídeo y datos sin servidores intermediarios para los medios.
Para iniciar una conexión, el proceso comienza creando un objeto RTCPeerConnection configurado con servidores STUN y TURN, que ICE (Interactive Connectivity Establishment) usa para descubrir la dirección IP pública y atravesar el NAT. Eso sí: entre el 20 y el 30 % de las conexiones reales en redes corporativas o móviles no consiguen establecer un canal P2P directo. En esos casos, ICE recurre a servidores TURN como relay, que transportan el flujo completo de medios y requieren infraestructura adicional en producción.
Cómo se establece una conexión con RTCPeerConnection
Para conectar dos peers, ambos siguen un protocolo de oferta y respuesta.
Primero, uno de los peers genera una oferta con el método createOffer() y la registra como su descripción local. Esa oferta incluye los formatos de medios soportados, los códecs disponibles y las posibles rutas de red (candidatos ICE). La oferta llega al otro peer a través de un servidor de señalización, que se limita a reenviarla sin procesarla.
Al recibirla, el peer receptor la establece como descripción remota, genera una respuesta con createAnswer() y la devuelve. Con eso, ambas partes se han intercambiado candidatos ICE y la conexión queda establecida.
Señalización
La señalización es el proceso que coordina la sesión antes de que los medios fluyan: intercambia descripciones de sesión, candidatos ICE y mensajes de control entre los peers.
WebRTC no define un protocolo de señalización concreto, así que cada desarrollador lo implementa según sus necesidades: WebSocket, HTTP y otros son opciones habituales. Es lo que permite iniciar, gestionar y cerrar una sesión P2P, así como negociar los metadatos de medios (resolución, códecs) entre ambos extremos.
Durante esa negociación, WebRTC selecciona los códecs que ambos peers soportan. Los más habituales son VP8, VP9, H.264 y AV1 para vídeo, y Opus para audio. AV1 está ganando terreno en 2026 gracias a su mayor eficiencia de compresión, especialmente relevante en conexiones con ancho de banda limitado.
P2P puro frente a SFU en llamadas grupales
Aquí hay un punto que cualquier desarrollador debe tener claro: el modelo P2P puro funciona bien para llamadas entre dos participantes, pero no escala más allá de tres o cuatro. En una malla P2P, cada participante tiene que enviar su propio flujo a todos los demás al mismo tiempo; el ancho de banda de subida y el consumo de batería lo hacen inviable en grupos más grandes.
Para llamadas grupales, las plataformas usan una SFU (Selective Forwarding Unit): un servidor que recibe el flujo de cada participante y lo reenvía selectivamente a los demás, reduciendo drásticamente la carga en el cliente. Esto sigue siendo WebRTC en el cliente, pero ya no es P2P puro: el servidor de medios está en medio. Es exactamente por eso que productos como Google Meet, Microsoft Teams o Digital Samba combinan las APIs de WebRTC en el navegador con infraestructura SFU en el servidor.
¿Para qué se usa WebRTC?
Comunicación de vídeo y audio
Las videollamadas son el caso de uso más visible de WebRTC. Al eliminar la dependencia de plugins o software externo, el navegador puede gestionar directamente la compresión y transmisión de los flujos multimedia. El resultado es una calidad buena y unos tiempos de establecimiento de llamada cortos, lo que lo hace adecuado para interacciones en tiempo real en múltiples plataformas.
Transferencia de datos entre peers
WebRTC no se limita al audio y el vídeo. La API RTCDataChannel permite transferir datos arbitrarios directamente entre peers: archivos, mensajes de chat, estados de aplicación. Es la opción natural para herramientas colaborativas que necesitan comunicación bidireccional en tiempo real sin pasar por un servidor central.
Compartición de pantalla
Con WebRTC, los usuarios pueden compartir su pantalla o una ventana concreta durante videollamadas y conferencias. Es especialmente útil en entornos educativos, de soporte técnico o reuniones de equipo, donde las ayudas visuales y la orientación en directo son imprescindibles para trabajar bien a distancia.
Privacidad y cifrado
WebRTC se diseñó desde el principio con la privacidad en mente: obliga al uso de DTLS-SRTP, una capa de cifrado de transporte que protege los flujos entre cada participante y el servidor de medios. Esto impide la interceptación en tránsito y es relevante para cumplir con el RGPD (Reglamento General de Protección de Datos, conocido como GDPR en inglés) y la LOPDGDD en España.
Conviene aclarar qué significa ese cifrado y qué no. En una arquitectura SFU estándar, el servidor de medios descifra y re-cifra los flujos al reenviarlos, lo que significa que tiene acceso al contenido en texto plano. El cifrado de extremo a extremo real (donde ni siquiera el servidor puede descifrar el contenido) requiere una capa adicional a nivel de aplicación mediante la API Insertable Streams; no viene activado por defecto y hay que implementarlo explícitamente.
Hay otro detalle de privacidad que merece atención: la API STUN puede exponer las direcciones IP locales del cliente al navegador, incluso a través de algunas VPNs. Los navegadores modernos ofrecen mecanismos para limitar esta filtración (hostnames mDNS en Chrome, opciones de privacidad en Firefox), pero en aplicaciones con requisitos estrictos de privacidad conviene aplicar filtrado de candidatos ICE o anonimización en servidor.
Streaming en directo y difusión
WebRTC también se usa en streaming en directo gracias a su baja latencia. Se adapta en tiempo real a las condiciones de red, de forma que mantiene la calidad del stream aunque el ancho de banda varíe. Eso lo hace válido para eventos en vivo, gaming interactivo y distribución de contenido donde los segundos de retardo importan.
Ventajas e inconvenientes de WebRTC
Ventajas de WebRTC
Código abierto, con comunidad activa. WebRTC es un estándar abierto del W3C al que cualquiera puede contribuir, lo que ha generado un ecosistema de herramientas, librerías y mejoras sostenido durante más de una década.
Compatible con todos los navegadores modernos. Chrome, Firefox, Safari y Microsoft Edge (en su versión Chromium, desde 2020) llevan WebRTC integrado sin necesidad de extensiones. También funciona en Opera, Brave y otros navegadores basados en Chromium, lo que cubre prácticamente cualquier entorno de usuario.
Flexible para casi cualquier caso de uso. WebRTC se adapta desde videochats sencillos hasta aplicaciones empresariales complejas. Google Meet, Facebook Messenger, Instagram Live y Digital Samba Embedded son ejemplos de productos muy distintos construidos sobre la misma tecnología base.
Cifrado de transporte obligatorio. Con DTLS-SRTP activo por defecto y E2EE disponible como capa adicional, WebRTC cifra el canal de comunicación en todo caso, algo necesario para el intercambio de datos sensibles. La diferencia entre ambos niveles se explica en la sección de privacidad.
Calidad de vídeo y audio adaptativa. Los mecanismos de control de congestión (transport-cc y GCC) ajustan el bitrate en tiempo real según las condiciones de red, por lo que la calidad se mantiene incluso cuando el ancho de banda varía.
Inconvenientes de WebRTC
Proceso de señalización que hay que implementar. La ausencia de un protocolo de señalización estandarizado significa que cada equipo tiene que construir o elegir el suyo. No es un bloqueo, pero sí una tarea de integración adicional al empezar.
Complejidad de despliegue para grupos. WebRTC P2P solo escala bien hasta dos o tres participantes. Las llamadas grupales necesitan una SFU (o equivalente), con toda la infraestructura que eso conlleva: no hay una solución lista de fábrica en la propia API.
Necesidad de servidores TURN. Entre el 20 y el 30 % de las conexiones reales en redes corporativas o móviles no pueden establecer P2P directo. Necesitas servidores TURN como fallback, con el coste de ancho de banda asociado a transportar flujos de medios completos.
Digital Samba y WebRTC en la práctica
Digital Samba, con sede en Barcelona, usa WebRTC para ofrecer videoconferencia grupal conforme con el RGPD y la LOPDGDD, con cifrado de transporte por defecto (DTLS-SRTP) y E2EE opcional como capa adicional. Toda la infraestructura está alojada en la UE, sin dependencia de hiperescaladores estadounidenses.
Nuestra API y SDK se integran en cualquier aplicación web, móvil o sitio web. Internamente usamos Janus como SFU, lo que permite escalar las llamadas grupales de forma eficiente sin que los clientes tengan que gestionar la infraestructura de medios.
En cuanto a lo que viene: AV1 está ganando adopción como códec de vídeo por su mejor eficiencia de compresión, y los protocolos WHIP/WHEP están emergiendo como estándar para integrar flujos WebRTC con pipelines de streaming existentes. Son desarrollos que seguiremos de cerca.
Si quieres incorporar WebRTC en tus proyectos, empieza con nuestro plan gratuito: 10.000 minutos al mes, sin coste, para que puedas probar la integración en tu propia aplicación.
Preguntas frecuentes (FAQ)
WebRTC son las siglas de Web Real-Time Communication. Es una tecnología de código abierto que permite la comunicación directa entre navegadores y aplicaciones móviles para intercambiar audio, vídeo y datos en tiempo real. Se usa habitualmente en videollamadas, conferencias online y compartición de archivos P2P, sin necesidad de instalar nada.
WebRTC establece conexiones P2P entre los dispositivos de los usuarios para compartir flujos de audio, vídeo y datos. Con sus APIs, gestiona la negociación de red y el procesamiento de los flujos multimedia, y configura la comunicación en tiempo real directamente en el navegador. Para llamadas con más de dos o tres participantes, la arquitectura habitual añade una SFU que distribuye los flujos de forma eficiente.
WebRTC sirve para videollamadas, llamadas de voz, streaming en directo y compartición de archivos, todo desde el navegador. Sus prestaciones lo hacen adecuado para plataformas de redes sociales, herramientas de e-learning, telemedicina y cualquier aplicación que necesite comunicación rápida y fiable sin plugins.
Los métodos tradicionales suelen requerir plugins o instalaciones externas. WebRTC ofrece un conjunto de APIs que permite compartir vídeo, audio y datos en tiempo real directamente en los navegadores compatibles, lo que mejora la experiencia de usuario y reduce la latencia al eliminar intermediarios.
Baja latencia, calidad multimedia alta, cifrado de transporte activo por defecto y sin necesidad de plugins de terceros. La integración nativa en los navegadores simplifica el desarrollo y reduce la complejidad de poner en marcha una solución de comunicación en tiempo real.
Janus es un servidor WebRTC de propósito general que gestiona y distribuye flujos multimedia, y que se usa habitualmente como gateway o SFU para aplicaciones que necesitan comunicación en tiempo real. Se encarga del escalado, la grabación y la gestión de flujos entre dispositivos. Digital Samba usa Janus como su SFU para las aplicaciones WebRTC.
