Trực quan hóa dữ liệu giống như việc nén thông tin vào một biểu đồ với mục tiêu là người đọc có thể giải nén và diễn giải các thông tin đã được “nén”. Tùy thuộc vào hình thức trực quan hóa dữ liệu mà các thông tin được “nén” có thể được giải nén dễ dàng và chính xác hay không. Chương 1 của sách Data Visualization: A practical introduction tổng hợp các hình thức trực quan hóa dữ liệu hiệu quả cho dữ liệu liên tục (continuous data) (Hình 1) và dữ liệu phân loại (categorical data) (Hình 3).
Hình 1: Các hình thức trực quan hóa dữ liệu liên tục từ hiệu quả tới không hiệu quả theo thứ tự từ trên xuống dưới từ Chương 1 sách Data Visualization: A practical introduction (Hình 1.24)
Ví dụ với dữ liệu liên tục, Hình 2 minh họa sự khác biệt giữa việc sử dụng “Vị trí trên cùng một trục” (Position on a common scale - hình thức hiệu quả nhất) và “Độ nghiên hoặc góc” (Tilt or Angle - hình thức ít hiệu quả hơn). Ta có thể thấy rất rõ là giá trị của nhóm 4 cao hơn nhóm 1 khi dùng hình thức “Vị trí dữ liệu trên một trục” (hình bên trái), nhưng sẽ khó để thấy hơn khi dùng hình thức “Độ nghiên hoặc góc” (hình bên phải).
Hình 2: Minh họa sự khác biệt giữa việc sử dụng hình thức “Vị trí trên cùng một trục” (Position on a common scale) và “Độ nghiên hoặc góc (Tilt or Angle)” cho dữ liệu liên tục phân loại
Hình 3: Các hình thức trực quan hóa dữ liệu phân loại từ hiệu quả tới không hiệu quả theo thứ tự từ trên xuống dưới từ Chương 1 sách Data Visualization: A practical introduction (Hình 1.25)
Ví dụ với dữ liệu phân loại, Hình 4 minh họa sự khác biệt giữa việc sử dụng “Màu sắc” (Color hue - hình thức hiệu quả thứ hai) và “Hình dạng” (Shape - hình thức ít hiệu quả nhất). Ta có thể thấy rất rõ chấm tròn xanh khi dùng hình thức “Màu sắc” (hai hình bên trái), nhưng sẽ khó để thấy hơn khi dùng hình thức “Hình dạng” (hai hình bên phải).
Hình 4: Minh họa sự khác biệt giữa việc sử dụng hình thức “Màu sắc” (Color hue) và “Hình dạng” cho dữ liệu phân loại (Trích Hình 1.18 sách Data Visualization: A practical introduction)