Tổng quan về kĩ thuật giấu tin
TỔNG QUAN VỀ KĨ THUẬT GIẤU TIN
1.1 KHÁI NIỆM VỀ GIẤU TIN
Sự bùng nổ của Internet và các đa phương tiện đã dẫn đến gia tăng các vấn nạn như ăn cắp bản quyền, xuyên tạc thông tin và truy nhập thông tin trái phép Điều này đòi hỏi cần có các giải pháp mới và hiệu quả để đảm bảo an toàn và bảo mật thông tin Một trong những giải pháp tiềm năng là kỹ thuật giấu tin, đã được nghiên cứu và phát triển trong khoảng 10 năm qua.
Giấu thông tin là kĩ thuật nhúng (hay còn gọi là giấu) một lượng thông tin số nào đó vào trong một đối tượng dữ liệu số khác
Kỹ thuật giấu tin có hai mục đích chính: bảo mật dữ liệu và bảo vệ đối tượng mang tin Hai mục đích này dẫn đến hai kỹ thuật chủ yếu là ẩn mã và thủy vân số Việc giấu tin trong đa phương tiện tận dụng "độ dư thừa" của phương tiện để thực hiện việc giấu tin, khiến người ngoài khó nhận biết sự tồn tại của thông tin ẩn giấu.
1.2 MÔ HÌNH GIẤU TIN CƠ BẢN
Giấu thông tin vào phương tiện chứa và tách lấy thông tin là hai quá trình trái ngược nhau a Giấu thông tin vào phương tiện chứa:
Quy trình giấu thông tin vào phương tiện chứa được mô tả qua sơ đồ khối hình 1.1 trong đó:
Thông tin cần được bảo mật tùy thuộc vào mục đích sử dụng của người dùng, có thể là các thông điệp bí mật hoặc các logo, hình ảnh có bản quyền.
• Phương tiện chứa: các file ảnh, text, audio, … là môi trường để nhúng tin
• Bộ nhúng thông tin: là những chương trình thực hiện việc giấu tin
• Đầu ra: là các phương tiện đã có tin giấu trong đó
Hình 1-1 Lược đồ chung cho quá trình giấu tin b Tách thông tin:
Phân phối Môi trường chứa
Môi trường chứa đã được giấu tin
Quá trình tách thông tin từ các phương tiện chứa diễn ra ngược lại với việc thông tin được giấu vào chúng Sau khi tách, các phương tiện chứa có thể được sử dụng và quản lý theo nhiều yêu cầu khác nhau.
Hình 1-2 Lược đồ chung cho quá trình giải mã
Hình 1-2 mô tả quy trình giải mã thông tin đã được giấu Khi nhận được phương tiện chứa thông tin, quá trình giải mã diễn ra thông qua bộ giải mã phù hợp với bộ nhúng thông tin và khóa tương ứng Kết quả thu được bao gồm phương tiện chứa gốc và thông tin đã được giấu Tiếp theo, thông tin đã giấu sẽ được kiểm định và so sánh với thông tin ban đầu.
1.3 PHÂN LOẠI KĨ THUẬT GIẤU TIN
1.3.1 Phân loại theo khuynh hướng
Môi trường chứa (audio, ảnh, video)
Môi trường chứa đã được giấu tin
Kĩ thuật giấu tin nhằm mục đích đảm bảo an toàn và bảo mật thông tin ở hai khía cạnh:
- Bảo mật dữ liệu đem giấu
- Bảo mật cho chính đối tượng được dùng để giấu tin
Từ hai khía cạnh trên đã dần hình thành nên hai khuynh hướng chủ yếu của giấu tin là:
• Ẩn mã (steganography): là kĩ thuật nhúng tin mật vào môi trường giấu tin.
Khuynh hướng này nhấn mạnh việc sử dụng các kỹ thuật ẩn giấu thông tin, nhằm tối đa hóa lượng dữ liệu được giấu kín Điều quan trọng là các phương pháp này phải đảm bảo rằng người khác khó có thể phát hiện ra sự tồn tại của thông tin ẩn bên trong một đối tượng bằng các kỹ thuật thông thường.
• Thủy vân số (watermaking): là kĩ thuật nhúng giấu ẩn số vào một tài liệu hoặc sản phẩm nhằm chứng thực nguồn gốc hay chủ sở hữu.
So sánh giữa ẩn mã và thủy vân số:
(Thủy vân số) Ẩn mã Thủy vân số
- Mục đích là bảo vệ thông tin - Mục đích là bảo vệ môi trường giấu tin
- Giấu được càng nhiều thông tin càng tốt, ứng dụng trong truyền dữ liệu thông tin mật
- Chỉ cần thông tin đủ để đặc trưng cho bản quyền của chủ sở hữu
- Thông tin được giấu phải ẩn, không cho người khác thấy được bằng mắt thường
- Thông tin giấu có thể ẩn (thủy vân ẩn) hoặc hiện (thủy vân hiện)
- Chỉ tiêu quan trọng nhất là dung lượng của tin được giấu
- Chỉ tiêu quan trọng nhất là tính bền vững của tin được giấu
Bảng 1-1 So sánh ẩn mã và thủy vân số
1.3.2 Phân loại theo môi trường giấu tin
Giấu thông tin trong ảnh là một phương pháp quan trọng trong các ứng dụng và phần mềm hiện nay, nhờ vào lượng thông tin lớn được truyền tải qua hình ảnh Kỹ thuật này không chỉ giúp bảo vệ an toàn thông tin như xác thực, phát hiện xuyên tạc, bảo vệ bản quyền và kiểm soát truy cập, mà còn đảm bảo rằng chất lượng ảnh không bị thay đổi đáng kể Với sự phát triển của ảnh số, việc giấu tin trong ảnh ngày càng trở nên phổ biến và ứng dụng rộng rãi trong nhiều lĩnh vực của đời sống xã hội.
Chữ ký bằng tay đã được số hóa và lưu trữ tại các nước phát triển, sử dụng trong dịch vụ ngân hàng và tài chính để xác thực thông tin, đặc biệt trong thẻ tín dụng Phần mềm Microsoft WinWord cho phép lưu trữ chữ ký dưới dạng ảnh nhị phân, gắn vào tài liệu để bảo mật thông tin Việc xác thực chữ ký trở nên quan trọng khi thông tin dễ bị đánh cắp bởi tin tặc, đặc biệt là những dữ liệu nhạy cảm như an ninh, bảo hiểm và tài chính Thông tin giấu trong ảnh một cách vô hình giúp truyền tải dữ liệu mật mà không bị phát hiện, giữ nguyên chất lượng ảnh Vụ tấn công ngày 11-9 đã chỉ ra rằng các tổ chức khủng bố như Al-Qaeda sử dụng phương pháp này để liên lạc, qua mặt các cơ quan tình báo Do đó, nghiên cứu về giấu tin trong ảnh đã thu hút sự chú ý đáng kể trong thời gian gần đây.
Hình 1-3 Một thông điệp của bọn khủng bố được FBI phát hiện và ngăn chặn kịp thời
Giấu tin trong audio có những đặc điểm riêng biệt so với các phương tiện đa phương tiện khác, do nó thuộc về hệ thống thính giác của con người Hệ thống này có khả năng nghe các tín hiệu ở dải tần rộng và công suất lớn, điều này tạo ra thách thức cho việc giấu tin Tuy nhiên, con người khó phát hiện sự khác biệt giữa các tần số và công suất, cho phép âm thanh to, cao tần che giấu âm thanh nhỏ, thấp tần một cách hiệu quả Chất lượng thông tin sau khi giấu cũng phụ thuộc vào kênh truyền; băng thông chậm có thể làm giảm chất lượng Ví dụ, để nhúng một đoạn java applet vào audio (16 bit, 44.100 Hz) với độ dài bình thường, cần ít nhất 20 bit/s Việc giấu thông tin trong audio yêu cầu tính đồng bộ và an toàn cao, và các phương pháp giấu tin thường khai thác điểm yếu trong hệ thống thính giác của con người.
Giấu thông tin trong video, tương tự như trong ảnh và audio, phụ thuộc vào khả năng thính giác và thị giác của con người, và phát triển theo hai hướng thủy vân và ẩn mã Công nghệ này ngày càng được chú trọng và phát triển mạnh mẽ, phục vụ cho nhiều ứng dụng như kiểm soát truy cập thông tin, xác thực dữ liệu và bảo vệ bản quyền tác giả.
Phương pháp giấu tin trong video do Cox đề xuất là phân phối đều, trong đó thông tin giấu được trải đều theo tần số của dữ liệu gốc Nhiều nghiên cứu đã áp dụng hàm cosin riêng và các hệ số truyền sóng riêng để thực hiện việc này Các thuật toán ban đầu chủ yếu cho phép giấu hình ảnh vào video, nhưng gần đây đã có các kỹ thuật cho phép giấu cả âm thanh lẫn hình ảnh Ví dụ, phương pháp của Swanson sử dụng kỹ thuật giấu theo khối, cho phép giấu hai bit trong khối 8 × 8, trong khi Mukherjee phát triển kỹ thuật giấu trong audio và video bằng cách sử dụng cấu trúc lưới đa chiều.
Kĩ thuật giấu thông tin trong video áp dụng cả những đặc điểm về thị giác và thính giác của con người.
• Giấu tin trong văn bản:
Giấu tin trong văn bản dạng text là một thách thức lớn vì thiếu thông tin dư thừa Để thực hiện điều này, cần khéo léo khai thác những dư thừa tự nhiên của ngôn ngữ Một phương pháp khác là sử dụng định dạng văn bản, chẳng hạn như mã hóa thông tin vào khoảng cách giữa các từ hoặc các dòng văn bản.
Kỹ thuật giấu tin hiện đang được áp dụng cho nhiều loại đối tượng, không chỉ riêng dữ liệu đa phương tiện như hình ảnh, âm thanh và video Gần đây, đã có một số nghiên cứu về việc giấu tin trong cơ sở dữ liệu quan hệ và các gói IP truyền trên mạng Rõ ràng, kỹ thuật này sẽ tiếp tục phát triển trong các môi trường dữ liệu số khác trong tương lai.
1.4 CÁC YẾU TỐ ẢNH HƯỞNG TỚI QUÁ TRÌNH GIẤU TIN
Các kỹ thuật giấu tin cần phải đáp ứng một số yếu tố quan trọng, tuy nhiên, các yếu tố này có thể thay đổi tùy theo từng ứng dụng cụ thể Dưới đây là các yếu tố chung cho các kỹ thuật giấu tin.
Sự thay đổi trên đối đượng chứa là tối thiểu
Mục đích của việc giấu tin là nhúng dữ liệu vào đối tượng chứa để phục vụ cho các ứng dụng khác nhau Tuy nhiên, quá trình này không được phép làm thay đổi giá trị sử dụng của đối tượng chứa.
Ẩn mã
2.1 TỔNG QUAN VỀ ẨN MÃ
2.1.1 Giới thiệu chung về ẩn mã
Từ “Steganography” có nguồn gốc từ tiếng Hi Lạp, với “stegano” có nghĩa là bí mật và “graphy” là văn bản Ẩn mã là nghệ thuật và khoa học trong việc giấu tin, nơi thông tin bí mật được mã hóa để che giấu sự tồn tại của nó Mục tiêu chính của ẩn mã là đảm bảo liên lạc an toàn mà không gây nghi ngờ trong quá trình truyền tải Phương pháp này không chỉ nhằm tránh để người khác biết mà còn khiến họ không nghĩ rằng thông tin đang được ẩn giấu Lịch sử của ẩn mã kéo dài hàng nghìn năm, với những ghi chép đầu tiên từ nhà sử học Hi Lạp Herodotus Một ví dụ nổi bật là vào thế kỷ thứ 5 trước Công Nguyên, khi Histiaeus gửi thông điệp mật bằng cách xăm lên đầu một nô lệ Một câu chuyện khác là Demeratus, người đã viết thông điệp lên bản gỗ và phủ sáp ong lên để tránh bị phát hiện khi thông báo về kế hoạch xâm lược của Xerxes.
Mực vô hình là một phương pháp cổ xưa để giấu tin mật, được người La Mã cổ đại sử dụng để viết giữa hai dòng chữ Thành phần của mực vô hình thường bao gồm nước tiểu, nước trái cây và sữa Khi được đốt nóng, mực này sẽ chuyển sang màu đen, giúp dễ dàng nhìn thấy Đặc biệt, trong Thế chiến thứ II, mực vô hình cũng đã được áp dụng để truyền tải thông tin bí mật.
Johannes Trithemius (1462-1526) là một trong những nhà nghiên cứu ẩn mã và mã hóa sớm nhất, nổi bật với tác phẩm Steganographia, trong đó ông mô tả các hệ thống ma thuật và một hệ thống mật mã phức tạp Tác phẩm này chỉ được công bố sau khi ông qua đời do lo ngại về sự phản tác dụng trong thời kỳ thống trị tôn giáo Quyển sách về ẩn mã đầu tiên, Steganographica, được viết bởi Gaspari Schotti vào năm 1665, mặc dù nội dung chủ yếu là của Trithemius, đánh dấu khởi đầu cho sự phát triển mới trong lĩnh vực này Trong suốt thế kỷ 15 và 16, ẩn mã tiếp tục phát triển, với nhiều tác giả giấu tên để tránh sự chỉ trích Bishop John Wilkins, thạc sĩ trường đại học Trinity, Cambridge, đã viết một luận án về ẩn mã, phát minh ra các phân loại thông điệp mã hóa trong âm nhạc và bảo vệ việc phát hành các tác phẩm trong lĩnh vực này.
Lĩnh vực này phát triển xa hơn vào 1883 với sự phát hành quyển
“Cryptographie militaire” của Auguste Kerckhoffs không chỉ tập trung vào mật mã mà còn trình bày những nguyên lý quan trọng trong thiết kế hệ thống ẩn mã Tiếp theo là “Les Filigranes” của Charle Briquet, xuất bản năm 1907, khám phá lịch sử của thủy vân.
Trong thế kỉ 19 - 20, ẩn mã đã được khai hóa, đặc biệt trong cuộc chiến tranh Boer (1899-1902) giữa người Boer và người Anh Lord Robert Baden-Powell, người sáng lập phong trào hướng đạo sinh và là một trinh sát của Anh, đã vẽ bản đồ các vị trí căn cứ pháo binh của người Boer trên cánh của các con bướm để tránh bị nghi ngờ khi bị bắt.
Thế chiến thứ II là giai đoạn quan trọng cho các thí nghiệm về ẩn mã, trong đó vào đầu cuộc chiến, kỹ thuật ẩn mã chủ yếu dựa vào việc sử dụng mực vô hình.
Trong quá trình truyền tải thông điệp mật, các mật mã trống (thông điệp không bị mã hóa) được sử dụng để ẩn giấu nội dung thực sự Những mật mã này thường có hình thức ngây thơ, vô hại và bình thường, giúp chúng không bị nghi ngờ và tránh bị chặn lại Một ví dụ điển hình là thông điệp mà tình báo Đức đã gửi trong Thế chiến II.
“Apparently neutral’s protest is thoroughly discounted and ignored Isman hard hit Blockade issue affects pretext for embargo onby-products, ejecting suets and vegetable oils.”
Giải mã thông điệp trên bằng cách lấy kí tự thứ hai ở mỗi từ:
“Pershing sails from NY june 1”
Sự sắp xếp trong văn bản có thể ẩn chứa thông tin quan trọng Thông điệp được thể hiện và nhận diện thông qua việc thay đổi vị trí của các hàng và từ ngữ.
Trong kỉ nguyên công nghệ số, ẩn mã đã trở thành một yếu tố quan trọng, đặc biệt với sự bùng nổ của các kĩ thuật ẩn mã trên dữ liệu số trong những năm gần đây Hai lí do chính cho sự phát triển này là nhu cầu bảo mật thông tin và sự gia tăng khối lượng dữ liệu cần được bảo vệ.
Ngành công nghiệp xuất bản và phát thanh truyền hình đang ngày càng chú trọng đến kỹ thuật ẩn giấu bản quyền, bao gồm việc mã hóa và sử dụng số seri trong các sản phẩm kỹ thuật số như phim, âm thanh, sách điện tử và các nội dung đa phương tiện.
Các chính phủ đang có những hành động nhằm hạn chế dịch vụ mã hóa, điều này đã thúc đẩy nhu cầu tìm hiểu các phương pháp nhúng thông tin riêng tư vào các đối tượng mang tin khác.
2.1.2 Nguyên lí cơ bản của ẩn mã học
Hầu hết các ứng dụng ẩn mã học đều tuân theo nguyên lý chung: Alice, người muốn chia sẻ thông điệp mật m với Bob, sẽ chọn ngẫu nhiên một thông điệp vô hại c, gọi là vật phủ Thông điệp c có thể được truyền đến Bob mà không gây nghi ngờ Sau đó, Alice gắn thông điệp bí mật vào trong c, biến nó thành vật stego s Quá trình này cần được thực hiện cẩn thận để người thứ ba chỉ biết thông điệp s không thể phát hiện ra sự tồn tại của thông điệp bí mật m.
Hình 2-5 Nguyên lí cơ bản của ẩn mã học
Trong một hệ thống lý tưởng, vật phủ thông thường không nên bị phân biệt với vật stego bởi con người hoặc máy tính khi tìm kiếm các mẫu thống kê Về lý thuyết, vật phủ có thể là bất kỳ loại dữ liệu nào mà máy tính có khả năng đọc, bao gồm tệp hình ảnh, âm thanh số và văn bản.
Alice đã gửi thông điệp qua một kênh không an toàn, hy vọng Wendy sẽ không phát hiện ra Bob có khả năng xây dựng lại thông tin vì anh ta biết cách kết nối thông tin mà Alice đã sử dụng Quá trình tách thông tin này có thể thực hiện mà không cần đến vật phủ gốc.
Trong quá trình truyền tin, một người theo dõi như Wendy không thể xác định được liệu vật phủ gửi đi có chứa thông tin mật hay không Cụ thể, nếu một người quan sát có quyền truy cập vào tập hợp các vật phủ được truyền giữa hai bên, họ vẫn không thể phân biệt được vật phủ nào chứa thông tin nhạy cảm Do đó, độ an toàn của quá trình truyền thông không nhìn thấy được chủ yếu dựa vào sự không thể phân biệt giữa vật phủ và vật stego.