Khi xem thông số kỹ thuật video của máy ảnh, bạn có thể đã nhận thấy các thông số kỹ thuật khác nhau được liệt kê cho ALL-I so với IPB, hoặc Intra-frame so với Long GOP. Đây là các phương pháp nén khác nhau giúp cho kích thước tập tin video trở nên dễ quản lý tương đối. Chúng khác nhau như thế nào, chúng hoạt động như thế nào, và bạn có thể chọn phương pháp tốt nhất cho dự án của mình bằng cách nào? Đọc tiếp để tìm hiểu thêm!
Tại sao một đoạn video 4K UHD 60p dài 10 phút không phải là 180GB
Bao gồm 36.000 hình ảnh, nó có thể đã dễ dàng đạt đến kích thước đó
Về cơ bản, video là một chuỗi các ảnh tĩnh liên tiếp (“khung hình”) tạo ra một hình ảnh chuyển động khi được phát theo trình tự. Nếu bạn quay ở 4K UHD 60p, tương đương với việc chụp ảnh tĩnh 3840×2160 pixel ở tốc độ 60 khung hình mỗi giây—hay 36.000 ảnh cho một đoạn video 10 phút! Mặc dù kích thước tập tin thực tế của mỗi hình ảnh phụ thuộc vào nội dung của nó, nhưng giả sử rằng một ảnh JPEG 3840×2160 thường có kích thước khoảng 5MB, thì 36.000 ảnh sẽ có kích thước khoảng 180GB.
Vậy tại sao một video 4K UHD 60p dài 10 phút không chiếm 180GB dung lượng tập tin trong đời thực? Một lý do là vì các video được nén (mã hóa) trong quá trình ghi để làm cho các tập tin trở nên dễ lưu trữ và truyền gửi hơn.
Phương pháp Nhóm Hình Ảnh (Group of Pictures, GOP) và IPB: I frame, P frame, và B frame
Một phương pháp nén là IPB/Nhóm Hình Ảnh (GOP), nó sử dụng thực tế là các khung hình liên tiếp, nhất là những khung hình được quay ở tốc độ khung hình cao, thường không khác nhiều so với hình ảnh trước đó. Do đó, thay vì xem mọi khung hình là một hình ảnh riêng lẻ, tách biệt và ghi lại tất cả thông tin hình ảnh cho mỗi khung hình trong quá trình nén (mã hóa), nó mã hóa một khung hình chính và sau đó, chỉ ghi lại thông tin về sự khác biệt so với khung hình trước đó. Phương pháp inter-frame này làm giảm lượng thông tin dư thừa và cho phép nén dữ liệu video hiệu quả hơn.
Khung hình chứa đầy đủ thông tin từ hình ảnh ngay cả khi được nén được gọi là khung hình chính, cũng được gọi là I frame. Nó không tham chiếu nội dung từ bất kỳ khung hình nào khác.
P frame (khung hình được dự đoán) và B frame (khung hình được dự đoán hai hướng) là những khung hình chỉ chứa thông tin về sự khác biệt so với các khung hình lân cận. Nói cách khác, chúng dựa vào các khung hình lân cận để lấy nội dung.
Ví dụ, trong hình minh họa, không có sự thay đổi trực quan về cây cối, do đó thông tin trên đó sẽ là dư thừa trong các khung hình tiếp theo. Do đó, P/B frame chỉ ghi lại những điểm khác biệt—nói cách khác là người đang chạy.
Do đó, một Nhóm Hình Ảnh (GOP) bao gồm một khung I frame, theo sau là một số khung P frame và B frame khác nhau.
– I frame (Khung hình được mã hóa trong)
Nén thông tin đầy đủ cho hình ảnh trong khung hình.
– P frame (Khung hình được dự đoán)
Dự đoán và chỉ ghi lại thông tin hình ảnh đã thay đổi so với khung hình trước đó.
– B frame (Khung hình được dự đoán hai hướng)
Giống như P frame, ngoại trừ việc chúng có thể tham chiếu thông tin hình ảnh ở cả khung hình trước và sau.
Vì IPB không ghi lại thông tin hình ảnh đầy đủ cho mỗi khung hình, nên các tập tin có thể nhỏ hơn nhiều so với các tập tin ALL-I/intra-frame. Tuy nhiên, tỉ lệ nén cao hơn cũng có nghĩa là các khung hình dễ gặp hiện tượng hình ảnh hiển thị không chính xác hơn. Các tập tin IPB cũng yêu cầu nhiều sức mạnh xử lý hơn để tạo và giải mã do các phép tính phức tạp liên quan.
ALL-I là gì?
ALL-I là “all I frames” (tất cả I frame). Trong phương pháp nén này, thông tin đầy đủ được ghi lại cho tất cả các khung hình và mỗi khung hình được nén riêng lẻ. Trên các máy ảnh Cinema EOS của Canon, phương pháp nén này được gọi là “Intra-frame”; trên dòng máy ảnh kỹ thuật số EOS series và các máy ảnh kỹ thuật số khác, nó được thể hiện là “ALL-I”. Về cơ bản, cả intra-frame và ALL-I đều hoạt động theo cùng cách.
Vì mọi khung hình đều chứa đầy đủ thông tin hình ảnh, các tập tin nén ALL-I/intra-frame thường lớn hơn các tập tin nén IPB. Tuy nhiên, chúng đòi hỏi ít sức mạnh xử lý hơn để tạo và giải mã. Chúng thường có chất lượng cao hơn, mặc dù điều đó cũng phụ thuộc vào bitrate ghi.
Sự khác biệt giữa IPB và Long GOP là gì?
Đối với nén bằng phương pháp IPB, số lượng khung P frame và B frame tham chiếu đến một khung I frame càng ít thì chất lượng video càng cao, và kích thước tập tin càng lớn. Ngược lại, càng nhiều khung P frame và B frame tham chiếu một khung I frame, thì kích thước tập tin càng nhỏ.
Long GOP thường nói đến GOP mở rộng (hơn 15 khung hình). Trên các máy ảnh Cinema EOS của Canon, phương pháp nén inter-frame (trong khung hình) được gọi là “Long GOP”, trong khi trên dòng máy ảnh kỹ thuật số EOS series và các máy ảnh kỹ thuật số khác, nó được thể hiện là “IPB”. Chúng khác nhau về số lượng khung hình trong GOP và do đó có tỉ lệ nén khác nhau; tuy nhiên, chúng về cơ bản là cùng một phương pháp.
ALL-I và IPB trong thực tế
Mặc dù chúng tôi đã đề cập rằng theo phương pháp IPB, một số khung hình chỉ chứa những điểm khác biệt so với khung trước đó, nhưng điều này cuối cùng đề cập đến phương pháp được sử dụng để mã hóa tín hiệu. Trong quá trình chỉnh sửa và phát lại, những tín hiệu này sẽ được giải mã trước khi hiển thị, do đó tất cả các khung hình mà bạn nhìn thấy sẽ hiển thị hình ảnh đầy đủ. Bạn sẽ không thể thấy bất kỳ khung hình nào chỉ hiển thị những điểm khác biệt!
Không có nhiều sự khác biệt rõ ràng về chất lượng video giữa các tập tin IPB và ALL-I. Tuy nhiên, vì chúng chứa nhiều thông tin hơn, các tập tin ALL-I chịu được quy trình xử lý hậu kỳ nặng tốt hơn.
Khi nào nên sử dụng phương pháp nào?
Một số nhà sản xuất video thấy ALL-I là phù hợp nhất với các cảnh động với nhiều chuyển động ngẫu nhiên, nhất là khi kích thước tập tin không phải là vấn đề. Trong khi đó, kích thước tập tin nhỏ hơn của IPB khiến nó trở nên thích hợp hơn cho các sự kiện, các buổi phỏng vấn, đám cưới, và các tình huống khác ở trạng thái tĩnh hơn và yêu cầu ghi liên tục.
Tóm tắt
– IPB/Long GOP và ALL-I/Intra-frame là các phương pháp nén video khác nhau trong quá trình mã hóa.
– Chúng khác nhau về cách xử lý các khung hình liên tiếp trong quá trình mã hóa.
IPB/Long GOP
– Các khung hình dưới dạng các Nhóm Hình Ảnh (GOP)
– Long GOP là IPB sử dụng các GOP mở rộng.
– Một GOP: Khung hình chính (I frame) với đầy đủ thông tin hình ảnh, tiếp theo là khung P frame và B frame (chỉ ghi lại những điểm khác biệt).
– Nén nhiều hơn = kích thước tập tin nhỏ hơn.
– Cần nhiều sức mạnh xử lý hơn để tạo và xử lý.
– Lý tưởng cho việc ghi thời gian dài.
ALL-I/Intra-frame
– Thông tin hình ảnh đầy đủ được mã hóa cho từng khung hình riêng lẻ. Hãy nghĩ, “TẤT CẢ khung hình đều là khung I frame”.
-Chứa nhiều dữ liệu hơn = kích thước tập tin lớn hơn.
-Yêu cầu ít sức mạnh xử lý hơn để tạo và xử lý.
-Kích thước đối với công việc đòi hỏi xử lý hậu kỳ nặng.