WCAG 1.2.2: Napisy (nagrane wcześniej)

Kryterium sukcesu 1.2.2 z wytycznych WCAG 2.0 i 2.1 na poziomie A dotyczy zapewnienia dostępności treści multimedialnych dla osób niesłyszących i słabosłyszących. Wymaga ono, aby wszystkie nagrane wcześniej treści audio w mediach zsynchronizowanych posiadały odpowiednio zsynchronizowane napisy, chyba że media te stanowią jedynie tekstową alternatywę.

Wprowadzenie do kryterium 1.2.2

Standard WCAG 1.2.2 „Napisy (nagrane wcześniej)” ma na celu zapewnienie równego dostępu do informacji zawartych w materiałach wideo, które zawierają nagrany wcześniej dźwięk. Oznacza to, że wszelkie dialogi, ważne efekty dźwiękowe oraz identyfikacja mówców muszą być przedstawione w formie tekstowej, zsynchronizowanej z bieżącym obrazem i dźwiękiem. Jest to podstawowy wymóg dla zapewnienia dostępności mediów dla szerokiego grona użytkowników.

Dlaczego to jest ważne? (Wpływ na dostępność)

Zapewnienie napisów do nagranych wcześniej treści wideo ma kluczowe znaczenie dla wielu grup użytkowników:

  • Osoby niesłyszące i słabosłyszące: Dla tej grupy napisy są podstawową formą dostępu do treści audio. Bez nich informacje przekazywane werbalnie byłyby całkowicie niedostępne.
  • Osoby z zaburzeniami poznawczymi: Napisy mogą pomóc w lepszym zrozumieniu i przetworzeniu informacji, zwłaszcza gdy mowa jest szybka lub używane jest skomplikowane słownictwo. Mogą również wspomagać koncentrację.
  • Osoby uczące się języka: Napisy w języku obcym mogą wspierać naukę i rozumienie, pozwalając na jednoczesne słyszenie i czytanie słów.
  • Osoby znajdujące się w trudnych warunkach: W miejscach publicznych, w głośnym otoczeniu lub w sytuacjach wymagających ciszy (np. w bibliotece, pracy), napisy umożliwiają konsumpcję treści wideo bez konieczności odtwarzania dźwięku.
  • Osoby z problemami technicznymi: Czasami słabej jakości dźwięk, szumy, czy problemy ze sprzętem audio mogą utrudniać zrozumienie. Napisy stanowią awaryjne rozwiązanie.

Kryteria sukcesu i wymagania

1.2.2 Napisy (nagrane wcześniej) (Poziom A)

Oficjalne sformułowanie kryterium sukcesu 1.2.2 brzmi:

Napisy muszą być dostępne dla wszystkich wcześniej nagranych treści audio w mediach zsynchronizowanych, z wyjątkiem sytuacji, gdy media są alternatywą dla tekstu.

Rozłożmy to na czynniki pierwsze:

  • „Napisy” (Captions): Oznaczają tekstową transkrypcję wszystkich dialogów i ważnych dźwięków (np. [Szczekanie psa], [Głośna muzyka], [Aplauz]), które występują w ścieżce audio. Napisy muszą być zsynchronizowane z odtwarzanym dźwiękiem i obrazem. Powinny również identyfikować mówców, jeśli nie są oni wizualnie odróżnialni lub jest to ważne dla kontekstu.
  • „Nagrane wcześniej” (Prerecorded): Odnosi się do treści, które nie są transmitowane na żywo, a zostały nagrane, zredagowane i opublikowane. Oznacza to, że istnieje wystarczająco dużo czasu, aby przygotować dokładne i wysokiej jakości napisy.
  • „Media zsynchronizowane” (Synchronized Media): To media, które zawierają zarówno informacje wizualne (wideo), jak i dźwiękowe (audio), i są ze sobą zsynchronizowane. Dotyczy to większości typowych materiałów wideo.
  • „Z wyjątkiem sytuacji, gdy media są alternatywą dla tekstu”: Jest to ważny wyjątek. Jeśli materiał wideo (np. czytanie książki audio) jest sam w sobie alternatywną wersją prezentacji treści, która już jest dostępna w formie tekstowej (np. pełny tekst książki), to nie ma wymogu dostarczania dodatkowych napisów dla samego wideo. Zakłada się, że użytkownik, który potrzebuje tekstu, może skorzystać z oryginalnej wersji tekstowej.

Praktyczne wytyczne dotyczące zgodności

Aby zapewnić zgodność z WCAG 1.2.2, należy przestrzegać następujących wytycznych:

  1. Tworzenie dokładnych napisów: Napisy powinny być jak najwierniejszą transkrypcją dialogów, uwzględniać kontekst oraz wszystkie istotne dźwięki niewerbalne.
  2. Synchronizacja: Napisy muszą pojawiać się na ekranie w tym samym czasie, w którym wypowiadane są słowa lub występują dźwięki. Opóźnienia mogą utrudnić lub uniemożliwić zrozumienie.
  3. Identyfikacja mówców: W przypadku wielu mówców należy jasno wskazać, kto aktualnie mówi (np. „Anna: Witam wszystkich”, „[Głos poza kadrem]: Czy masz pytania?”).
  4. Opis dźwięków niewerbalnych: Wszystkie ważne dźwięki, które przekazują informacje (np. [Syrena karetki], [Głośny śmiech], [Tajemnicza muzyka]), powinny być opisane w nawiasach kwadratowych lub okrągłych.
  5. Format plików napisów: Najczęściej używane formaty to WebVTT (.vtt) i SRT (.srt). Format WebVTT jest natywnie wspierany przez element HTML5 <track>, co ułatwia implementację.
  6. Implementacja w odtwarzaczach wideo: Używaj standardowego elementu HTML5 <video> wraz z elementem <track>, aby osadzić napisy. Umożliwia to przeglądarkom i odtwarzaczom wideo wyświetlanie i zarządzanie napisami.
  7. Jakość językowa: Napisy powinny być poprawne gramatycznie i ortograficznie, łatwe do czytania i zrozumiałe.

Przykłady implementacji

Przykład prawidłowej implementacji

Poniższy przykład pokazuje, jak osadzić plik z napisami w formacie WebVTT w elemencie HTML5 <video>. Użytkownik może włączyć lub wyłączyć napisy za pomocą kontrolerów odtwarzacza.

<video controls width="640" height="360" poster="miniatura-wideo.jpg">
    <source src="moje-wideo.mp4" type="video/mp4">
    <source src="moje-wideo.webm" type="video/webm">
    <!-- Element <track> dla napisów w języku polskim -->
    <track kind="captions" src="napisy-pl.vtt" srclang="pl" label="Polskie napisy" default>
    <!-- Opcjonalnie, inne języki -->
    <track kind="captions" src="captions-en.vtt" srclang="en" label="English captions">
    <p>Twoja przeglądarka nie obsługuje wideo. Możesz <a href="moje-wideo.mp4">pobrać wideo</a> lub zapoznać się z <a href="transkrypcja.html">pełną transkrypcją</a>.</p>
</video>

<!-- Przykładowa zawartość pliku napisy-pl.vtt -->
WEBVTT

1
00:00:01.000 --> 00:00:04.500
Witajcie na naszej prezentacji na temat dostępności.

2
00:00:05.000 --> 00:00:08.000
[Muzyka w tle, cicha melodia]
Dostępność jest kluczowa dla wszystkich.

3
00:00:08.500 --> 00:00:12.000
(Prelegentka Anna Kowalska)
Zapewnia równe szanse dla każdego użytkownika.

Przykład nieprawidłowej implementacji

Poniższy przykład przedstawia wideo bez jakichkolwiek napisów lub wideo z napisami „wypalonymi” (hardcoded), których użytkownik nie może wyłączyć ani dostosować.

<video controls width="640" height="360" src="moje-wideo-bez-napisow.mp4" poster="miniatura-wideo.jpg">
    <!-- Brak elementu <track> dla napisów -->
    <p>Twoja przeglądarka nie obsługuje wideo. Możesz <a href="moje-wideo-bez-napisow.mp4">pobrać wideo</a>.</p>
</video>

<!-- Lub wideo z napisami wbudowanymi na stałe, które uniemożliwiają personalizację
     przez użytkownika lub ich wyłączenie, co również jest niezgodne, jeśli nie ma
     alternatywy z wyłączalnymi napisami. -->
<video controls width="640" height="360" src="wideo-z-wypalonymi-napisami.mp4" poster="miniatura-wideo.jpg">
    <p>Twoja przeglądarka nie obsługuje wideo.</p>
</video>

Dobre praktyki i częste pułapki

Dobre praktyki

  • Zawsze recenzuj napisy: Nigdy nie polegaj wyłącznie na automatycznie generowanych napisach bez ich weryfikacji przez człowieka. Automatyczne generowanie jest pomocne jako punkt wyjścia, ale często zawiera błędy.
  • Zapewnij opcje personalizacji: Chociaż przeglądarki zazwyczaj zapewniają podstawowe opcje stylizacji napisów, jeśli używasz niestandardowego odtwarzacza wideo, rozważ dodanie możliwości zmiany rozmiaru czcionki, koloru, tła lub pozycji napisów.
  • Dostarczaj transkrypcje: Oprócz napisów, oferowanie pełnej transkrypcji tekstu audio-wideo na osobnej stronie może być bardzo korzystne dla osób, które wolą czytać, lub dla tych, którzy mają trudności z koncentracją na napisach w trakcie oglądania wideo.
  • Testuj na różnych urządzeniach: Upewnij się, że napisy działają poprawnie i są czytelne na różnych urządzeniach i rozmiarach ekranu (desktop, tablet, smartfon).
  • Wspieraj wiele języków: Jeśli twoje treści są przeznaczone dla międzynarodowej publiczności, dostarczaj napisy w różnych językach.

Częste pułapki

  • Brak napisów: Najczęstsza i najbardziej rażąca niezgodność to całkowity brak napisów do nagranych wcześniej treści wideo.
  • Napisy automatyczne bez weryfikacji: Używanie automatycznie generowanych napisów (np. z YouTube) bez sprawdzenia ich dokładności, co prowadzi do błędów, opóźnień i braku opisów dźwięków.
  • Napisy niesynchronizowane: Napisy, które pojawiają się zbyt wcześnie, zbyt późno lub znikają zbyt szybko, zanim użytkownik zdąży je przeczytać.
  • Napisy niekompletne: Brak transkrypcji wszystkich dialogów lub pomijanie ważnych informacji dźwiękowych.
  • Napisy trudne do odczytania: Zbyt mała czcionka, słaby kontrast z tłem, zbyt duża liczba znaków w linii, lub zbyt krótki czas wyświetlania.
  • Brak możliwości włączania/wyłączania: Napisy „wypalone” w wideo, które nie dają użytkownikowi kontroli nad ich wyświetlaniem.

Podsumowanie

Kryterium sukcesu WCAG 1.2.2 „Napisy (nagrane wcześniej)” jest fundamentalne dla zapewnienia inkluzywnego dostępu do treści multimedialnych. Zastosowanie dokładnych, zsynchronizowanych i dobrze sformatowanych napisów to nie tylko wymóg prawny w wielu jurysdykcjach, ale przede wszystkim wyraz dbałości o wszystkich użytkowników. Pamiętając o dobrych praktykach i unikając częstych pułapek, możemy tworzyć witryny i aplikacje, które są naprawdę dostępne.

Przegląd prywatności

Ta strona korzysta z ciasteczek, aby zapewnić Ci najlepszą możliwą obsługę. Informacje o ciasteczkach są przechowywane w przeglądarce i wykonują funkcje takie jak rozpoznawanie Cię po powrocie na naszą stronę internetową i pomaganie naszemu zespołowi w zrozumieniu, które sekcje witryny są dla Ciebie najbardziej interesujące i przydatne.