Giới thiệu

Các bài viết sẽ nhằm vào bất cứ đề tài gì mà tôi có hứng thú muốn đề cập, không theo một chủ đề nhất định. Nguyên tắc viết không theo khuôn khổ và tự do thoải mái nhất có thể, nội dung bài viết cũng sẽ thay đổi liên tục theo thời gian nên sẽ rất khó theo dõi. Bên cạnh đó, độ dài của các bài viết rất bất định, nhiều khi dài lê thê và tràn lan.

Các quy tắc chung (Đọc kỹ trước khi quyết định đọc nội dung bài viết):
Điều 1. Nội dung bài viết có thể dựa hoàn toàn vào quan điểm cá nhân, do đó sẽ khác với quan điểm của bạn. Bạn luôn có quyền ngừng đọc hoặc không cần đọc. Tuy nhiên, một khi đã đọc, bạn không được phép tranh cãi với tác giả. (Bạn được quyền nói xấu tác giả, nếu thích). Tác giả không chịu bất cứ trách nhiệm nào nếu nội dung bài viết gây ảnh hưởng xấu đến sức khỏe hay tâm lý của bạn.
Điều 2. Nội dung bài viết có thể chứa rất nhiều "spoiler" nên khuyên bạn không nên đọc trước khi xem/chơi tựa phim/anime/video game... được nhắc đến trong bài viết. Tác giả không chịu trách nhiệm vì làm bạn mất hứng. Bên cạnh đó, vì sở thích mỗi người mỗi khác, những chi tiết mà tác giả chê khen có thể không giống cách đánh giá của bạn, nên đừng dùng nó làm cơ sở lựa chọn. Ngoài ra, xem lại điều 1.
Điều 3. Bài viết chỉ được phép tồn tại trên blog này. Bạn không được quyền sao chép toàn bộ hay một phần nội dung của bất cứ bài viết nào sang nơi khác (bạn được phép đăng link của bài viết đi nơi khác, nếu muốn). Tác giả phủ nhận hoàn toàn trách nhiệm liên quan đến nội dung bài viết nếu nó được phát tán nơi khác dưới hình thức không phải link, tuy nhiên vẫn giữ quyền đối với nó.

2012-03-03

Phụ đề không định dạng có liên quan đến độ phân giải video?

Có lẽ cái tiêu đề làm ai đó đọc phải thấy hơi bối rối. Tôi phải thừa nhận rằng mình không giỏi trong việc đặt tên tiêu đề bài viết cho lắm. Tuy nhiên chẳng nên để tâm chuyện đó làm gì, điều tôi muốn nói đến ở đây là tình trạng hiểu sai của nhiều người rằng phụ đề không định dạng như SubRip (.srt), SAMI (.smi)... có liên quan đến độ phân giải của video, trong khi chúng không hề. (Gọi là phụ đề không định dạng đơn giản là để phân biệt với dạng phụ đề chứa thông tin định dạng sẵn như SSA/ASS, chứ không hẳn chính xác, chẳng hạn tùy thuộc vào renderer mà SubRip có thể dùng một số định dạng thông qua HTML tags, phổ biến là Italic, Bold, Color... Bản thân SSA/ASS trước khi render cũng chỉ là plain-text).

Đồng ý, đoạn trên vẫn chưa rõ ràng lắm, tôi sẽ nêu ví dụ cho dễ hình dung. Bạn thử tìm phụ đề cho một bộ phim có phát hành Blu-ray Disc trên Subscene.com, bạn sẽ bắt gặp rất nhiều phụ đề của cùng một ngôn ngữ (phụ thuộc vào độ nổi tiếng và phổ biến của bộ phim). Tất nhiên tôi không nói đến những bản dịch khác nhau, vì vậy tôi giả sử bộ phim đó chỉ dùng tiếng Anh, và bạn tìm phụ đề tiếng Anh cho nó. Sau khi lọc ra phụ đề tiếng Anh, giờ chúng ta chỉ tìm phụ đề được OCR từ BD chứ không tính đến mấy cái phụ đề dành cho Cam, TS, DVDScr... gì gì đó. Lúc này bạn vẫn sẽ choáng ngợp bởi rất nhiều bản phụ đề cho những bản release khác nhau từ các nhóm encode khác nhau (mà "dân gian" quen gọi là "nhóm Rip"), và đây là điểm bắt đầu của điều mà bài viết muốn đề cập.

Bạn sẽ bắt gặp nhiều phụ đề cho cùng một nhóm Rip, nhưng cho các bản release với độ phân giải khác nhau của họ, chẳng hạn Some.Movie.2011.720p-SomeGroup và Some.Movie.2011.1080p-SomeGroup, trong khi hai bản này về bản chất có timing y chang như nhau. Đối với phụ đề không định dạng như SRT, độ phân giải chẳng ảnh hưởng gì đến phần trình bày của nó, yếu tố quan trọng là timing cho khớp mà thôi. Nói đến điều này, vì trên lý thuyết các nhóm Rip đều encode từ cùng nguồn (BD) nên nếu họ làm đúng cách và không cắt bỏ đoạn nào hay làm mất quá nhiều khung hình thì các bản release sẽ có cùng timing. (Một số trường hợp ngoại lệ khi nội dung phim trải dài trên hơn 1 BD, các nhóm Rip sẽ có những nguyên tắc khác nhau khi ghép hai phần lại làm một, chẳng hạn có nhóm bỏ đoạn silence đầu Disc 2 có nhóm lại giữ nguyên; hoặc giữa bản Theatrical và Director's Cut/Extended/Special Edition). Như vậy, nếu phụ đề được OCR từ nguồn BD, (giả định nhà phát hành không làm ẩu) trên lý thuyết nó sẽ khớp timing với tất cả các bản release, không phân biệt độ phân giải, nhóm Rip. Điểm khác nhau chỉ có thể là: các lỗi OCR khác nhau hoặc ít hay nhiều lỗi OCR, phụ đề bình thường hay phụ đề dành cho người khiếm thính, có giữ lại thuộc tính Italic hay không, để nguyên hay ngắt câu ở những câu thoại quá dài...

Gần đây một số người chuyên cung cấp phụ đề OCR từ BD đã bắt đầu dùng kiểu "all BD version" hoặc tương tự thay vì cùng lúc đăng nhiều phiên bản khác nhau (nhưng thực chất là một) cho các nhóm Rip. Điều buồn cười nữa là, nếu bạn đăng một phụ đề nhưng không ghi rõ nó được "khớp" với bản release nào, cơ hội là nhiều người không thèm ngó ngàng tới nó, bất kể bạn bỏ bao công sức và thời gian để canh time (và dịch, nếu bản đó do bạn dịch).