Si alguna vez has configurado un encoder para streaming, te habrás encontrado con la misma pregunta: ¿CBR o VBR? La respuesta depende de para qué estás codificando, y elegir mal afecta directamente a la calidad, el tamaño del archivo y los costes de ancho de banda. Este artículo te explica las diferencias, cuándo usar cada modo y qué ocurre en la práctica con tecnologías como WebRTC.
En este artículo analizamos las ventajas e inconvenientes de cada modo y comentamos escenarios donde uno puede ser más adecuado que el otro.
Índice
El bitrate es la cantidad de datos que se transmiten por segundo en streaming y codificación de vídeo. Piénsalo como el caudal de agua a través de una tubería: cuanto mayor sea el bitrate, más datos fluyen, lo que afecta tanto a la calidad del vídeo como al tamaño del archivo.
Se mide en kilobits por segundo (kbps) o megabits por segundo (Mbps). Un bitrate más alto se traduce en mejor calidad, pero también en archivos más grandes y mayor consumo de ancho de banda.
Ajustar el bitrate te permite elegir entre distintos niveles de calidad. Resoluciones como 240p, 360p, 480p, 720p y 1080p implican requisitos de bitrate diferentes. Cuanto más alta sea la resolución y la tasa de fotogramas, más datos necesitas para conseguir imágenes nítidas y movimiento fluido.
Hay tres factores principales:
El bitrate constante (CBR) significa que el codificador produce datos a una tasa fija, sin tener en cuenta el tamaño ni la complejidad del contenido que está procesando.
Por la limitación de latencia, las plataformas de videoconferencia trabajan con bitrates más bajos que el streaming en directo: una llamada HD 1:1 típica ronda 1–2 Mbps, frente a los 3–6 Mbps recomendados para 720p60 en YouTube Live. CBR encaja bien con esta restricción porque mantiene un caudal predecible que el control de congestión puede gestionar sin picos bruscos.
Para evitar el buffering y mantener la calidad, los servicios de streaming regulan la cantidad de datos transmitidos por segundo con técnicas de control de tasa CBR. Así consiguen una experiencia de visualización uniforme, aunque sea a costa de algo de eficiencia en las escenas más sencillas.
CBR lleva décadas siendo el estándar del streaming online y es compatible con la gran mayoría de dispositivos de reproducción y pipelines de ingestión en directo.
La codificación con bitrate variable (VBR) transmite datos a una tasa que varía en función de la complejidad del contenido: el codificador empaqueta más bits donde hacen falta y menos donde el contenido es sencillo.
El bitrate medio de un archivo VBR es simplemente el total de bits dividido por la duración; lo que cambia es cómo se reparten esos bits entre escenas. El codificador asigna más bits a las escenas complejas (movimiento rápido, mucho detalle) y menos a las sencillas, manteniendo el objetivo de calidad y, en general, un tamaño de archivo más reducido.
VBR, al variar el bitrate según la escena, es muy adecuado para la transcodificación de vídeo bajo demanda. Eso sí, el streaming VBR funciona mejor con VOD que con emisiones en directo, porque los codificadores en tiempo real no pueden realizar el análisis en dos pasadas que aprovecha al máximo sus ventajas. Para VOD de alta calidad, lo que se usa casi siempre es VBR en dos pasadas (2-pass VBR): el codificador analiza el vídeo completo en una primera pasada y distribuye los bits de forma óptima en la segunda.
El factor de tasa constante (CRF) es el modo de codificación orientado a la calidad que usan por defecto x264 y x265 en la mayoría de flujos de trabajo de edición y VOD. En lugar de fijar un bitrate, fija un objetivo de calidad perceptiva: el codificador calcula el bitrate necesario fotograma a fotograma según la complejidad visual. Las escenas con mucho detalle o movimiento reciben más bits; los planos estáticos o sencillos, menos. El resultado es el mejor equilibrio posible entre calidad y tamaño de archivo en una codificación de pasada única.
Los principales conversores de vídeo y editores no lineales lo usan como modo predeterminado en x264 y x265.
A diferencia de CBR (bitrate fijo) y VBR (bitrate que varía según la complejidad), CRF ofrece una calidad visual uniforme a cualquier nivel de complejidad de escena, con un tamaño de archivo variable según el contenido.
Existe también el modo CQ (cuantizador constante, o CQP), que aplica el mismo parámetro de cuantización a todos los fotogramas sin la lógica perceptiva de CRF. El resultado es una compresión matemáticamente uniforme, pero la calidad percibida varía, porque el ojo nota más los artefactos en escenas estáticas que en las de movimiento rápido. CRF es la opción preferida en la mayoría de casos; CQP tiene usos específicos en entornos donde se necesita un nivel de cuantización estrictamente fijo.
Vamos al grano: esta tabla recoge los ejes que más importan a la hora de elegir.
| Aspecto | CBR (bitrate constante) | VBR (bitrate variable) |
|---|---|---|
| Asignación de bitrate | Tasa fija para todo el vídeo | Se ajusta según la complejidad del contenido |
| Calidad de vídeo | Calidad estable en todo el stream; puede mostrar artefactos en escenas complejas | Mayor calidad en escenas complejas; menor en las escenas simples |
| Tamaño de archivo | Predecible y estable | Variable; archivos más pequeños para contenido con mucha escena tranquila |
| Streaming adaptativo (ABR) | CBR es la base estándar de cada rendición en HLS/DASH; el ABR cambia entre rendiciones, no entre modos de bitrate | VBR en dos pasadas es habitual en las rendiciones VOD de las escaleras ABR |
| Eficiencia de ancho de banda | Menos eficiente que VBR; su ventaja es la previsibilidad, no la eficiencia | Mejor aprovechamiento del ancho de banda; los picos en escenas complejas pueden aumentar los costes de CDN |
| Eficiencia de almacenamiento | Tamaño predecible; fácil de planificar el almacenamiento | Tamaños variables; los archivos VBR son típicamente un 20–40 % más pequeños para la misma calidad percibida |
| Ideal para | Streaming en directo, videollamadas, pipelines con límite de tasa estricto | VOD, archivado, contenido pregrabado donde el tamaño de archivo importa |
| Tipos de contenido | Contenido con complejidad visual constante | Contenido dinámico con variedad visual |
| Complejidad de configuración | Sencillo: fija el bitrate y listo | Requiere entender los ajustes de calidad objetivo y, para máxima eficiencia, configurar 2-pass |
| Latencia | Caudal predecible, idóneo para buffers ajustados en streaming de baja latencia | Los picos pueden complicar la gestión del buffer en tiempo real |
Conviene aclarar un punto que el debate CBR/VBR deja en la sombra: la mayoría de las plataformas grandes (Netflix, YouTube, Twitch, Disney+) no eligen entre CBR y VBR de forma global. Usan streaming de bitrate adaptativo (ABR) a través de HLS o MPEG-DASH: codifican el mismo vídeo en varias rendiciones (por ejemplo, 240p, 480p, 720p y 1080p), las trocean en segmentos de pocos segundos y dejan que el reproductor cambie de rendición automáticamente según el ancho de banda disponible.
La elección entre CBR y VBR se aplica dentro de cada rendición. Para directo, las rendiciones suelen ser CBR (tamaño de segmento predecible). Para VOD, pueden ser VBR en dos pasadas. Así que si vas a montar un pipeline de distribución profesional, la decisión sobre CBR/VBR es una subpregunta dentro de cómo construyes tu escalera ABR.
Cuando el ancho de banda es limitado o la red es inestable, CBR es la opción más segura.
El tipo de contenido también influye en la elección.
Para streaming en directo en plataformas como Twitch, CBR es obligatorio: Twitch lo exige porque su pipeline de ingestión no tolera picos de bitrate. Sin embargo, YouTube Live y la mayoría de los encoders de hardware modernos (NVENC, QuickSync) admiten VBR capeado (o CRF capeado): el codificador varía el bitrate para cazar la calidad, pero no supera un techo máximo. OBS Studio lo expone como opción «VBR restringido». Si la plataforma lo acepta, el VBR capeado da mejor calidad visual que el CBR puro al mismo bitrate medio.
Para vídeo en directo en plataformas que lo permiten, prueba el VBR capeado. Para subir vídeo bajo demanda, VBR en dos pasadas (o CRF) es la opción estándar.
Los codificadores más extendidos son x264 (para H.264/AVC), x265 (para H.265/HEVC), VVenC (para H.266/VVC) y AV1 mediante libsvtav1 o libaom. Cada uno tiene sus puntos fuertes; x264 sigue siendo el más compatible, y AV1 ofrece la mejor eficiencia en compresión a costa de tiempos de codificación más altos.
El rango útil de CRF en x264 va de 18 (visualmente sin pérdida apreciable) a 28 (calidad aceptable para web). El valor predeterminado es 23 en x264 y 28 en x265. Cuanto menor sea el valor, más bits gasta y mejor calidad obtienes.
Los presets de velocidad (de ultrafast a veryslow) controlan el tiempo de codificación: un preset más lento saca mejor compresión del mismo CRF. Para VOD de calidad, usa slow o veryslow; para directo en tiempo real, fast o veryfast es lo habitual.
Streaming en directo de baja latencia
Usa CBR (o VBR capeado si la plataforma lo admite) con presets rápidos (fast, faster) para minimizar la latencia del encoder. Un bitrate típico para 720p30 en CBR ronda los 2.500–4.000 kbps; para 1080p30, entre 4.500 y 6.000 kbps.
Contenido bajo demanda de alta calidad
Usa CRF con preset slow o veryslow y, si el tiempo lo permite, 2-pass VBR. Para 1080p con x264, CRF 18–22 da resultados excelentes. Si distribuyes en ABR, crea una escalera de rendiciones (720p, 1080p, etc.) y codifica cada una por separado.
WebRTC (navegadores y videollamadas)
Los códecs nativos de WebRTC son VP8, VP9, H.264 y, en navegadores modernos, AV1. El control de bitrate lo gestiona el stack de WebRTC, no el usuario directamente; puedes fijar anchos de banda máximos y mínimos por pista desde el SDK.
La videoconferencia de Digital Samba funciona sobre WebRTC. El ancho de banda se asigna de forma dinámica en cada llamada: más datos van al hablante activo y a las pantallas compartidas, menos a las miniaturas inactivas. Por eso las llamadas mantienen la claridad cuando la red de un participante empeora, sin forzar al resto a una calidad mínima.
WebRTC no «cambia entre CBR y VBR»; aplica un control de congestión continuo (Google Congestion Control / transport-cc) que ajusta el bitrate objetivo del codificador en tiempo real según la red. En llamadas grupales, los SFUs modernos usan Simulcast (varias resoluciones del mismo flujo transmitidas simultáneamente) o SVC (capas escalables) para entregar a cada receptor la calidad que su red puede aceptar, sin sacrificar la del resto. En la práctica, el resultado se parece a un CBR adaptativo dentro de cada capa: el codificador apunta a un bitrate estable por capa y el SFU enruta la capa adecuada para cada receptor.
Integra videoconferencia cifrada y conforme con el RGPD con bitrate adaptativo WebRTC. Consulta la documentación del SDK de Digital Samba Embedded para los detalles de configuración.
Digital Samba, con sede en Barcelona, ofrece un plan gratuito que incluye 10.000 minutos de participación al mes para desarrolladores que crean aplicaciones de vídeo en tiempo real. Toda la infraestructura está alojada en la UE, cumpliendo con el RGPD y la LOPDGDD.