HỌC VIỆN KỸ THUẬT MẬT MÃ KHOA AN TOÀN THÔNG TIN BÀI TẬP LỚN MÔN HỌC KỸ THUẬT GIẤU TIN KỸ THUẬT GIẤU TIN TRONG ẢNH STEGANOGRAPHY VÀ PHÂN TÍCH TIN ẨN GIẤU BẰNG PHƯƠNG PHÁP ÁNH XẠ ĐIỂM ẢNH
Trang 1HỌC VIỆN KỸ THUẬT MẬT MÃ KHOA AN TOÀN THÔNG TIN
BÀI TẬP LỚN MÔN HỌC
KỸ THUẬT GIẤU TIN
KỸ THUẬT GIẤU TIN TRONG ẢNH STEGANOGRAPHY VÀ PHÂN TÍCH TIN ẨN GIẤU BẰNG PHƯƠNG PHÁP ÁNH XẠ
ĐIỂM ẢNH
Sinh viên: Nguyễn Viết Hoàng
Đỗ Hữu Hưởng Phạm Duy Khánh Trịnh Đình Đức Phùng Đức Dũng Giảng viên: Hoàng Thị Thảo
Hà Nội, 2-2022
Trang 2Mục lục
Lời mở đầu 3
Tóm tắt 4
I Giới thiệu chung 5
1.1 Steganography vs Cryptography 5
1.2 Phân tích tin ẩn giấu (Steganalysis) 9
II Cơ chế tồn tại 11
Tổng hợp 13
III Kế hoạch đề xuất 14
3.1 Phương pháp chọn pixel 14
3.2 Lấy mẫu (Sampling) 15
3.3 Lấy mẫu lại (Resampling) 15
4 Kết Luận (Conclusion) 16
2
Trang 3Lời mở đầu
Cuộc cách mạng thông tin kỹ thuật số đã đem lại những thay đổi sâu sắc trong xã hội và trong cuộc sống của chúng ta Những thuận lợi mà thông tin kỹ thuật số mang lại cũng sinh ra những thách thức và cơ hội mới cho quá trình đổi mới Sự ra đời những phần mềm có tính năng rất mạnh, các thiết bị mới như máy ảnh kỹ thuật số, máy quét chất lượng cao, máy in, máy ghi âm kỹ thuật số, v.v…, đã với tới thế giới tiêu dùng rộng lớn để sáng tạo, xử lý và thưởng thức các dữ liệu đa phương tiện (multimedia data) Mạng Internet toàn cầu đã biến thành một xã hội ảo nơi diễn ra quá trình trao đổi thông tin trong mọi lĩnh vực chính trị, quân sự, quốc phòng, kinh tế, thương mại… Và chính trong môi trường mở và tiện nghi như thế xuất hiện những vấn nạn, tiêu cực đang rất cần đến các giải pháp hữu hiệu cho vấn đề an toàn thông tin như nạn ăn cắp bản quyền, nạn xuyên tạc thông tin, truy nhập thông tin trái phép v.v Đi tìm giải pháp cho những vấn đề này không chỉ giúp ta hiểu thêm về công nghệ phức tạp đang phát triển rất nhanh này mà còn đưa ra những cơ hội kinh tế mới cần khám phá
Trong một quá trình phát triển lâu dài, nhiều phương pháp bảo vệ thông tin đã được đưa ra trong đó giải pháp dùng mật mã học là giải pháp được ứng dụng rộng rãi nhất Các hệ mã mật đã được phát triển nhanh chóng và được ứng dụng rất phổ biến cho đến tận ngày nay Thông tin ban đầu sẽ được mã hoá thành các ký hiệu vô nghĩa, sau đó sẽ được lấy lại thông qua việc giải mã nhờ khoá của hệ mã Đã có rất nhiều những hệ mã phức tạp được sử dụng như DES, RSA, NAPSACK và phương pháp này đã được chứng minh thực tế là rất hiệu quả và được ứng dụng phổ biến
Nhưng ở đây ta không định nói về các hệ mã mật mà ta tìm hiểu về một phương pháp đã và đang được nghiên cứu và ứng dụng rất mạnh mẽ ở nhiều nước trên thế giới đó là phương pháp giấu tin (Data hiding) Đây là phương pháp mới và phức tạp, nó đang được xem như một công nghệ chìa khoá cho vấn
đề bảo vệ bản quyền, nhận thực thông tin và điều khiển truy cập… ứng dụng trong an toàn và bảo mật thông tin
Trang 5Tóm tắt
Steganography là một phương pháp liên quan đến việc nhúng một giao tiếp vào một nhà cung cấp dịch vụ thích hợp, ví dụ như một hình ảnh hoặc một tệp âm thanh Sau đó, nhà cung cấp dịch vụ có thể được gửi đến một người nhận
mà không ai khác biết rằng nó chứa một thông tin liên lạc được che giấu Mục đích của công việc này là để điều tra các phương pháp steganography khác nhau
và cách chúng được sử dụng để giao tiếp bí mật LSB là một phương tiện được công nhận rất tốt trong lĩnh vực này Trong hình ảnh nhị phân, chúng tôi bị giới hạn rất nhiều về khoảng cách vì chỉ có 4 bit hoặc 8 bit là biểu tượng của một pixel, điều này dẫn đến việc chúng tôi hạn chế sử dụng các phương pháp LSB phổ biến nhất Hình ảnh 24 bit với ba kênh RGB đa dạng, nếu sử dụng không gian màu RGB Vì vậy, chúng ta có thể khảo sát rất nhiều phương pháp mới có thể vận hành hoặc sử dụng các kênh hình ảnh màu khác nhau trong mẫu thông thường hoặc tùy ý để che giấu thông tin Sử dụng ý tưởng này, chúng tôi đã khám phá các phương pháp ẩn dữ liệu tích cực khác nhau trong các hình ảnh có màu và tạo điểm giao nhau giữa các thao tác pixel tùy ý, Phương pháp LSB và Phân đoạn phức hợp mặt phẳng bit để đề xuất công việc của chúng tôi sử dụng kênh ngẫu nhiên và phương pháp ánh xạ pixel để tiết lộ sự xuất hiện của dữ liệu trong một hoặc hai kênh khác Chúng tôi đã chứng minh rằng nỗ lực này cho thấy một kết quả hấp dẫn so với các thuật toán hiện tại khác về các tham số khác nhau như bảo mật, khả năng không nhạy cảm và độ mạnh mẽ Ở phần cuối, quy trình steganography mới cũng được so sánh với các kỹ thuật hiện có
Trang 6I Giới thiệu chung
1.1 Steganography vs Cryptography
Trong thời gian đầu hàng ngày, từ các tạp chí, đến các phương tiện truyền thông thông thường, tạp chí khoa học, chiến dịch chính trị, phòng xử án và những trò lừa bịp bằng hình ảnh xuất hiện trong hộp thư đến email của chúng tôi, sự xuất hiện của các kỹ thuật kỹ thuật số được coi là bình thường và họ được tuyển dụng với tỷ lệ tăng lên Ẩn dữ liệu là một trong những vấn đề khó khăn trong lĩnh vực An ninh mạng
Trong mật mã, thông tin có thể được nhìn thấy nhưng không có bất kỳ hình thức có ý nghĩa nào Chỉ khi biết thuật toán mật mã, dữ liệu ẩn mới có thể được giải mã Trong mật mã mọi người đều biết rằng có thông tin ẩn hiện Tuy nhiên, chỉ có thuật toán phù hợp mới có thể tiết lộ tức là trong mật mã, một thông điệp có thể dễ dàng nhìn thấy và được công nhận là thông điệp khó hiểu nhưng chỉ người có thông tin về cách dữ liệu được mã hóa mới biết cách giải
mã nó
Mật mã được hình thành như một phương pháp để đảm bảo tính bí mật của thông điệp Nhiều phương pháp khác nhau đã được phát triển để mã hóa và giải mã dữ liệu nhằm giữ bí mật cho thông điệp Thật không may, đôi khi giữ bí mật nội dung của một tin nhắn là không đủ Vì vậy, cần phải giữ bí mật về sự tồn tại của thông điệp
Không giống như mật mã, Steganography được sử dụng để che giấu sự tồn tại của giao tiếp bí mật bằng cách nhúng thông tin liên lạc đằng sau bất kỳ bài viết bao thư nào như tệp hình ảnh, văn bản, âm thanh, video Mật mã mạng che chở một loạt các kỹ thuật
Steganography là một hình thức che dấu sự tồn tại của thông điệp Khác với Cryptography thì Steganography ẩn đi các thông tin cần giữ bí mật trong các
dữ liệu vô hại để đối phương không thể biết được sự hiện diện của thông điệp
Kỹ thuật số watermarking là phương pháp nhúng thông tin vào nội dung
đa phương tiện kỹ thuật số sao cho thông tin sau này có thể được trích xuất hoặc phát hiện cho nhiều mục đích khác nhau cùng với việc tránh sao chép và sắp
6
Trang 7xếp Kỹ thuật in watermarking đã trở thành một lĩnh vực học hỏi và phát triển năng động và có ý nghĩa Việc thương mại hóa các kỹ thuật watermarking đang được coi là cần thiết để hỗ trợ một số thách thức phải đối mặt với việc tạo ra nội dung kỹ thuật số nhanh chóng Sự khác biệt chính giữa ẩn thông tin và watermarking là thiếu một đối thủ tích cực Trong các ứng dụng tạo hình mờ như bảo vệ và xác nhận bản quyền, có một đối thủ tích cực sẽ cố gắng loại bỏ, hủy bỏ hoặc làm sai lệch hình mờ Trong ẩn thông tin không có kẻ thù sống động như vậy không có giá trị liên quan đến hoạt động loại bỏ thông tin ẩn trong nội dung Tuy nhiên, các kỹ thuật che giấu thông tin đòi hỏi phải kiên trì chống lại sự bóp méo ngẫu nhiên Chèn hình mờ ở phía nguồn bao gồm tạo tín hiệu hình mờ W và nhúng W vào hình ảnh gốc I để có được hình ảnh có hình
mờ I Mặt còn lại là trích xuất hình mờ W và đưa ra thước đo độ tin cậy cho hình ảnh được phát hiện Hình 1 cho thấy hình mờ chung được nhúng ở phía nguồn Chúng ta có hình ảnh watermarked I = f1 (I, W, K), trong đó K biểu thị khóa Chèn hình mờ ở phía nguồn bao gồm tạo tín hiệu hình mờ W và nhúng W vào hình ảnh gốc I để có được hình ảnh có hình mờ I Mặt còn lại là trích xuất hình mờ W và đưa ra thước đo độ tin cậy cho hình ảnh được phát hiện Hình 1 cho thấy hình mờ chung được nhúng ở phía nguồn Chúng ta có hình ảnh watermarked I = f1 (I, W, K), trong đó K biểu thị khóa Chèn hình mờ ở phía nguồn bao gồm tạo tín hiệu hình mờ W và nhúng W vào hình ảnh gốc I để có được hình ảnh có hình mờ I Mặt còn lại là trích xuất hình mờ W và đưa ra thước đo độ tin cậy cho hình ảnh được phát hiện Hình 1 cho thấy hình mờ chung được nhúng ở phía nguồn Chúng ta có hình ảnh watermarked I = f1 (I,
W, K), trong đó K biểu thị khóa
Trang 8Không giống như ẩn thông tin và kỹ thuật số, mục tiêu chính của kỹ thuật
in ẩn là truyền đạt một cách mạnh mẽ theo cách hoàn toàn không thể theo dõi được Ảnh JPEG được sử dụng rộng rãi nhất trong các phương pháp khắc chìm
và in ẩn (steganography)
Hình ảnh là phương tiện truyền thông phổ biến nhất Chúng được sử dụng
để in mật mã theo cách tiếp cận sau đây Trước tiên, tin nhắn có thể được mã hóa Người gửi nhúng thông tin liên lạc bí mật để được gửi vào một tệp đồ họa Điều này dẫn đến việc tạo ra cái được gọi là stego-image Dữ liệu bí mật bổ sung có thể cần thiết trong quá trình ẩn, ví dụ: một khóa stego Ảnh stego sau đó được truyền tới bộ thu Máy thu nhận thông tin liên lạc từ hình ảnh sóng mang Thư chỉ có thể được trích xuất nếu có một bí mật được chia sẻ bởi người gửi và người nhận Đây có thể là thuật toán để loại bỏ hoặc một sự cân nhắc bất thường chẳng hạn như một khóa Một trong những kỹ thuật thường được sử dụng là LSB trong đó bit quan trọng nhất của mỗi pixel được thay thế bằng các bit bí mật cho đến khi thông điệp bí mật kết thúc
Steganography đề cập đến phương pháp giấu thư bí mật vào các phương tiện như văn bản, âm thanh, hình ảnh và video mà không có bất kỳ nghi ngờ nào [12] Nó có thể được sử dụng vì lợi ích của nhân loại để phục vụ chúng ta cũng như cho những kẻ khủng bố và tội phạm nhằm mục đích xấu xa Trong lịch sử, các kỹ thuật mật mã đa dạng với các đặc tính không thể nhận biết, không thể phát hiện, tính mạnh mẽ và khả năng đã được dự đoán
Để ẩn thông tin trong bất kỳ phương tiện nào, hãy sử dụng các tính năng rất quan trọng như phương tiện che hoặc tệp cần thiết để ẩn dữ liệu, dữ liệu bí mật cần được ẩn và khóa hoặc từ mã có thể được người gửi và người nhận sử dụng để mã hóa và giải mã
Steganography có nguồn gốc từ tiếng Hy Lạp và có nghĩa là chữ viết tiết
ra Ở đây, stega có nghĩa là được bao phủ từ từ steganos trong tiếng Hy Lạp và nography có nghĩa là viết từ từ graphia trong tiếng Hy Lạp
8
Trang 9Phương pháp steganography bắt đầu bằng cách xác định ảnh bìa và thông tin cần che giấu Steganography là một nghệ thuật cổ xưa nhưng chuyên môn kỹ thuật số cung cấp cho nó một cách mới để có thể ẩn thông tin trong hình ảnh và tín hiệu kỹ thuật số Mục tiêu của kỹ thuật in ẩn là chèn một thông điệp vào một phương tiện trang bìa trông vô hại để việc kiểm tra thông thường đối với phương tiện kết quả sẽ không tiết lộ sự tồn tại của thông điệp
Ví dụ: với văn bản thuần túy làm phương tiện trang bìa, một điệp viên Đức, trong Thế chiến thứ nhất, đã gửi thông báo sau:
Rõ ràng sự phản đối của phe trung lập bị giảm giá triệt để và bị phớt lờ Vấn đề phong tỏa ảnh hưởng đến lý do cấm vận các sản phẩm phụ, đẩy ra đường và dầu thực vật
Điều này khi kiểm tra thông thường có vẻ khá an toàn Tuy nhiên, khi ký
tự thứ hai của mỗi từ được trích xuất, văn bản này được coi là ký tự cho thông báo sau:
Pershing ra khơi từ NY ngày 1 tháng 6
Với sự ra đời của Internet và sự truyền bá rộng rãi của một lượng lớn các phương tiện kỹ thuật số, hình ảnh kỹ thuật số đã trở thành một phương tiện trang bìa phổ biến cho các công cụ steganography Ngoài việc gần như phổ biến trên hầu hết các trang web, hình ảnh kỹ thuật số rất thích hợp làm phương tiện
Trang 10trang bìa Ví dụ: hình ảnh màu không nén có kích thước 640 X 480 có thể ẩn khoảng 100.000 ký tự văn bản
1.2 Phân tích tin ẩn giấu (Steganalysis)
Các phương pháp phân tích mật mã mới hơn và phong cách hơn để nhúng thông tin liên lạc bí mật sẽ yêu cầu các phương pháp phân tích mật mã chiếm ưu thế hơn để nhận dạng Steganalysis là nghệ thuật tấn công steganography trong một cuộc xung đột không bao giờ kết thúc
Steganalysis là kỹ thuật phát hiện sự tồn tại của thông tin ẩn giấu trong multimedia Giống như thám mã, mục đích của Steganalysis là phát hiện ra thông tin ẩn và phá vỡ tính bí mật của vật mang tin ẩn
Steganalysis là khả năng và kỷ luật khám phá sự tồn tại của steganography Steganalysis là một phương pháp phát hiện thông tin liên lạc bí mật được ẩn bằng cách sử dụng steganography Mục tiêu của phân tích mật mã
là thu thập đủ bằng chứng về sự tồn tại của thông điệp nhúng và phá vỡ tính bảo mật của sóng mang nó Do đó phá vỡ bảo mật được cung cấp bởi steganography Cả steganography và steganalysis đều đã nhận được rất nhiều thông báo từ cơ quan thực thi pháp luật và phương tiện truyền thông Cuộc chiến giữa kỹ thuật học và phân tích mật mã không bao giờ đi đến hồi kết
Mục tiêu cuối cùng của phân tích ẩn là quyết định xem một hình ảnh có chứa một thông điệp được nhúng hay không Khi lĩnh vực này đã phát triển, việc xác định độ dài của thông điệp và nội dung thực tế của thông điệp cũng đang trở thành lĩnh vực nghiên cứu tích cực
Phân tích ảnh có giấu thông tin thường dựa vào các yếu tố sau:
- Phân tích dựa vào các đối tượng đã mang tin
- Phân tích bằng so sánh đặc trưng: So sánh vật mang tin chưa được giấu tin với vật mang tin đã được giấu tin, đưa ra sự khác biệt giữa chúng
- Phân tích dựa vào thông điệp cần giấu để dò tìm
10
Trang 11- Phân tích dựa vào các thuật toán giấu tin và các đối tượng giấu đã biết: Kiểu phân tích này phải quyết định các đặc trưng của đối tượng giấu tin, chỉ ra công
cụ giấu tin (thuật toán) đã sử dụng
- Phân tích dựa vào thuật toán giấu tin, đối tượng gốc và đối tượng sau khi giấu tin
Có hai cách tiếp cận cuộc khủng hoảng phân tích học Một là đưa ra một phương pháp phân tích mật mã chính xác cho một thuật toán mật mã cụ thể Kỹ thuật còn lại chỉ là những kỹ thuật bắt đầu độc lập với thuật toán steganographic được phân tích Mỗi phương pháp trong số hai phương pháp đều có giá trị và điểm yếu riêng
Tầm quan trọng của các kỹ thuật phân tích mật mã có thể nhận thấy một cách đáng tin cậy sự tồn tại của thông tin được che giấu trong hình ảnh ngày càng tăng Steganalysis được phân thành: Statistical Steganalysis và Signature Steganalysis Khi dữ liệu bí mật ẩn trong một hình ảnh thì số liệu thống kê của một hình ảnh đã thay đổi Do thêm thông tin bí mật này vào hình ảnh, các giá trị pixel của nó sẽ thay đổi Sự thay đổi thống kê của hình ảnh này được sử dụng trong quá trình phân tích để nhận thấy dữ liệu bí mật Vì vậy, các phương pháp phân tích mật mã hiện nay thường được chia thành một trong hai loại: nhúng cụ thể hoặc phổ quát (ví dụ, [1]) Trong khi phân tích mật mã phổ quát cố gắng phát hiện sự tồn tại của một thông điệp nhúng độc lập với thuật toán nhúng và
lý tưởng nhất là định dạng hình ảnh, việc nhúng các phương pháp tiếp cận cụ thể để phân tích mật mã tận dụng các chi tiết thuật toán cụ thể của thuật toán nhúng Phân tích mật mã mù dựa trên việc phân loại các vectơ chất lượng bắt chước từ hình ảnh ngày càng trở nên mạnh mẽ hơn [4] Với số lượng ngày càng tăng của các công cụ phân tích mật mã, các phương pháp tiếp cận phổ quát rõ ràng là cần thiết để thực hiện bất kỳ loại phân tích mật mã chung, quy mô lớn nào
Phân tích ẩn thống kê phổ quát bao gồm các kỹ thuật phân tích mật thống
kê không được sử dụng cho một phương pháp ẩn mật mã cụ thể Ý tưởng chính đằng sau những kỹ thuật này là tìm ra một số đại lượng thống kê phù hợp có khả năng “phân biệt” SVM, mạng Neural, thuật toán phân cụm và các kỹ thuật