III. PHÂN TÍCH THỐNG KÊ BIẾN DỊ CÁ THỂ
2. Xử lý thống kê số liệu thu được
Trong trường hợp một dấu hiệu (phân tích một chiều) thì hai chỉ số thống kê cơ bản là số trung bình cộng M và phương sai V (còn gọi là độ lêch bình phương trung bình - SD). Biết được hai đại lượng này có thể tính toán được phần lớn các đặc điểm thống kê còn lại.
Các kết quả phân tích lô vật mẫu khá lớn được biểu thị bằng đồ thị thì đường phân bố thu được thường được gọi là phân bố chuẩn. Sự biến dị của phần lớn các dấu hiệu sinh học có dạng phân bố chuẩn.
Độ lệch trung bình được dùng làm độ đo biến dị của lô mẫu. Độ phân giải
của các giá trị riêng biệt đối với đại lượng trung bình càng lớn, đường biểu diễn càng “bẹt ” thì độ lệch chuẩn trung bình càng lớn. Biết được đại lượng SD của quần thể, có thể dự đoán được giới hạn biến dị, vì rằng trong trường hợp phân bố chuẩn khoảng cách :
M ± 1 SD bao gồm 68,27 % quần thể M ± 2 SD bao gồm 95,45 % quần thể M ± 3 SD bao gồm 99,73 % quần thể
Sai số chuẩn bình phương. Hay còn gọi là giá trị cho biết độ lệch chuẩn của bất kỳ tập hợp số do nào.Giá trị độ lệch chuẩn chỉ có thể tiến hành trên cơ sở một dãy số thu được. theo công thức sau:
SE = N SD
Mặc dù về lý thuyết chỉ cần 3 số cũng có thể tính độ lêch chuẩn, tuy nhiên thông thường sử dụng tập hợp mẫu từ 20-30 số đo là thích hợp nhất cho bất kỳ xử lý thống kê nào.
Hệ số biến thiên (Coefficient of Variability = CV). Giá trị số lượng của SD chỉ có nghĩa đối với đại lượng trung bình của dấu hiệu của chính lô vật mẫu.
Nếu SD bằng hai, trong lúc đó đại lượng trung bình bằng 120, điều đó chỉ ra rằng sự biến dị rất thấp, còn nếu trị số trung bình bằng 8 thì biến dị rất cao. Để có thể so sánh mức độ biến dị các loài khác nhau, nên tính hệ số biến thiên (CV). Nó thể hiện độ lệch chuẩn trung bình ở phần trăm của giá trị trung bình.
CV = M SD.100
Giá trị số lượng CV phụ thuộc vào dấu hiệu đo đạc và nhóm phân loại được xem xét. Các giá trị CV khác nhau đối với các dấu hiệu đếm được, các dấu hiệu đo được bằng thước và tương quan. Đại lượng CV phản ánh tính đồng nhất của lô vật mẫu. Ví dụ, nếu CV của một số chỉ số thống kê của cả nhóm lô vật mẫu bằng khoảng 4,5, còn của một lô vật mẫu bằng 9,2 thì cần nghiên cứu lại lô vật mẫu này, vì chắc chắn trong lô vật mẫu này có các cá thể của loài đồng hình hay các vật mẫu mà giới tính của chúng không xác định đúng, hay các thành phần lạ nào khác. Ở các vùng có sự xen kẽ thứ cấp giữa các phân loài thì thường giá trị CV tăng lên đáng kể. Việc đánh giá CV đặc biệt có lợi khi nghiên cứu so sánh các lô vật mẫu của một loài thu thập từ các vùng khác nhau hoặc khi so sánh biến dị của các cá thể dễ biến đổi khác nhau trong cùng một lô vật mẫu. Mặc dù hệ số biến thiên được các nhà phân loại học sử dụng một cách rộng rãi, nhưng vẫn còn có những nhược điểm lớn là không có các chuẩn thống kê để so sánh các giá trị CV khác nhau. Bởi vậy Lewontin (1966) đã đề nghị dùng phương sai (SD) của logarit của số đo để thay thế CV. Giá trị này biểu thị
tính biến dị, mà sẽ bất biến trong phép nhân; không phụ thuộc vào đơn vị đo (đơn vị mét hay không phải mét). Đối với các giá trị của CV nhỏ hơn 30 (thường gặp trong phân loại học) có thể sử dụng phương pháp rút gọn; trong trường hợp này bình phương của CV bằng phương sai của logarit tự nhiên (theo cơ số e) và có thể dùng nó trong chuẩn thống kê.
Đo chiều dài. Kích thước tuyệt đối của toàn cơ thể hoặc những kích thước của các phần riêng lẻ của động vật có vú trưởng thành và đặc biệt của chim rất cố định. Ở các côn trùng đã đạt được giai đoạn trưởng thành sau khi lột xác hoặc biến thái có thể có CV bé đối với số đo chiều dài, vì sau khi vỏ ngoài đã rắn lại thì chúng ngừng phát triển. Tuy nhiên kích thước cuối cùng của trưởng thành ở mức độ nào đó phụ thuộc vào các điều kiện dinh dưỡng của ấu trùng và thiếu trùng, vì thế có thể quan sát được các biến dị theo các dấu hiệu này. Ở các nhóm động vật mà sự phát triển của chúng xảy ra suốt đời như cá, rắn, san hô và động vật hình rêu thì kích thước biến đổi đó không có ý nghĩa. Muốn sử dụng cho phân loại thì cần phân tích hai chiều và nhiều chiều, đặc biệt sử dụng phương pháp phân tích hồi quy đa phần.
Các dấu hiệu đếm được. Những dấu hiệu như số lượng đốt, vẩy, gai hoặc gai, v.v. thuộc về biến dị đếm được. Một số dấu hiệu đếm được nào đó tuyệt đối cố định, ví dụ như số mắt ở động vật có vú, một số dấu hiệu khác ít nhiều bị biến dị và thường biến dị này là đặc trưng cho loài nào đó. Số lượng vảy ở rắn hoặc tia vây ở cá là những ví dụ. Các dấu hiệu đếm được không phải luôn luôn rời rạc đặc biệt ở đầu hoặc cuối của một lô, vì thế giá trị số lượng của chúng đôi khi phải xác định ngẫu nhiên.
Các tỷ lệ. Những đặc điểm thống kê thường có quan hệ đến sự biến thiên của đại lương tuyệt đối của các dấu hiêu riêng biệt. Tuy nhiên trong phân loại học tỷ lệ so sánh giữa các đại lượng đôi khi lại có giá trị lớn hơn so với kích thước tuyệt đối. Ví dụ như tỷ lệ của hai số đo của hai phần cơ thể thường cho nhiều thông tin hơn so với số đo chiều dài. Để sử dụng, các tý lệ này được trình bày dưới dạng đại lượng nhỏ theo phần trăm của đại lượng lớn:
R (tỷ lệ) = 1 100 . s
S là một trong các đại lượng nhỏ, còn l là đại lượng lớn. Thường người ta sử dụng các tỷ lệ chiều dài đầu gối với chiều dài thân (không kể đầu), chiều dài đuôi đối với chiều dài thân, chiều rộng so với chiều dài sọ, v.v. Những tỷ lệ này có thể tính được một cách nhanh chóng nhờ thước logarit. Nếu R gần băng 100 thì có thể là trong một vài lô mẫu s sẽ lớn hơn l. Tất nhiên là trong các trường hợp này s và l không cần chuyển chỗ, thậm chí nếu R lớn hơn 100.
Có thể trình bày các tỷ lệ một cách rõ ràng hơn ở dạng đồ thị, trên đó một đại lượng được sắp xếp theo trục hoành còn đại lượng khác theo trục tung. Khi muốn
xác định các kích thước tương đối của một cơ quan hay phần phụ nào đó, cần lựa chọn tiêu chuẩn thích hợp để so sánh. Ví dụ, chiều rộng tương đối của đầu ở côn trùng được tính theo tỷ lệ đối với chiều dài của đầu (không có vòi). Chiều dài tương đối của đuôi chim thường được tính theo tỷ lệ đối với cánh (xem như chỉ tiêu của kích thước chung). Tuy nhiên cánh không thể dùng chỉ tiêu chính xác của các kích thước chung ở chim di cư và ở các loài bay giỏi, và cả ở một số chim sử dụng cánh khi khoe mẽ. Ở các dạng này độ đo tốt nhất có lẽ là căn bậc 3 của trọng lượng cơ thể. Nếu kích thước của phần phụ tùy thuộc vào kích thước toàn bộ, ví dụ chiều dài đuôi đối với chiều dài cơ thể thì không nên đưa phần phụ vào toàn bộ; nên thừa nhận chiều dài thân không kể đuôi là chiều dài “toàn bộ”.
Bất kỳ tỷ lệ nào cũng có ẩn ý loại hình cũng như đại lượng trung bình. Vì vậy có thể tính được một cách không đồng đều tỷ số các số đo trong những trường hợp khi lô mẫu rất không đồng nhất về tuổi và kích thước hay nếu các phần cơ thể khác nhau được so sánh phát triển không đồng đều. Đồng thời tốt nhất là tiến hành phân tích hồi quy và trong trường hợp phát triển không đồng đều, biểu diễn tính biến dị bằng đồ thị theo thang logarit. Khi so sánh kích thước tuyệt đối với kích thước tương đối của phần nào đó của cơ thể bằng đồ thị, sự phụ thuộc về độ dài đôi khi được thể hiện rõ. Trong trường hợp các tỷ lệ và hồi quy so sánh hai kích thước hay thay đổi, cần sử dụng phương pháp phân tích nhiều chiều.
Chuẩn-t. Đó là phưong pháp thống kê thuận tiện nhất cho pháp xác định sự sai khác giữa hai lô mẫu là có “ý nghĩa” hay không. Trong những trường hợp sử dụng phân tích nhiều chiều thì chuẩn tương ứng được gọi là chuẩn-T2.
So sánh tần số. Khi cần xác định tần số của hai dạng hình (hoặc những biến thể khác) trong hai hoặc hơn hai quần thể có giống nhau không, nếu như sắp xếp được một cách không giới hạn bằng các lô mẫu lớn, thì có thể xác định được tần số một cách đơn giản bằng tỷ lệ phần trăm. Với số lượng các lô mẫu hạn chế, chuẩn được sử dụng chỉ ra xác suất nào thì các quần thể từ đó đã rút ra các lô mẫu là khác nhau hoặc tương ứng với xác suất nào thì những sai khác được quan sát đã gây ra do những sự ngẫu nhiên khi thu thập các lô mẫu, chuẩn này gọi là chuẩn X2. Mức độ tin cậy của giá trị X2 này được nêu ra ở các bảng giá trị P, mà có thể tìm được chúng trong mọi sách chỉ dẫn về thống kê. Chuẩn X2 hoàn toàn nhạy cảm đối với kích thước của lô vật mẫu.