R là một “môi trường phần mềm miễn phí dành cho tính toán thống kê và đồ
họa” được dùng phổ biến trong nghiên cứu khoa học. Lợi ích của việc dùng
R có thể xem ở bài viết R 101 | 7 Lý do nên dùng
R. Trong bài
viết này mình sẽ chia sẻ kinh nghiệm của mình về việc học R từ con số 0.
- Cài RStudio: RStudio
là một phần mềm giúp cho việc sử dụng R dễ dàng hơn. Ví dụ, bạn có
thể quản lý các file code (góc trái Hình 1), các dữ
liệu trong quá trình làm việc (góc phải phía trên Hình
1), cũng như hiển thị dữ liệu (góc phải phía dưới Hình
1).
- Học các kiến thức R cơ bản: bạn có thể học kiến thức R cơ bản miễn
phí từ sách R for Data Science. Có thể
bạn sẽ cảm thấy việc học các kiến thức cơ bản hơi nhàm chán và chậm
chạp, trong khi bạn muốn bắt đầu vào thực hành ngay. Tuy nhiên, việc
nắm vững các kiến thức cơ bản rất quan trọng vì sẽ giúp bạn có thể
thực hành R rất nhanh sau này. Một số mục mình thấy quan trọng với
người mới học bao gồm: Whole game, Visualize, Transform, Import
(Spreadsheets), và có thể cả Program. Sách không có bản tiếng Việt
nhưng có thể dùng google translate trong Chrome để dịch (Hình
2).
- Thực hành: sau khi học xong các kiến thức cơ bản thì bạn nên thực
hành R càng nhiều càng tốt, đúng theo phương châm “trăm hay không
bằng tay quen”. Tốt nhất là bạn có thể áp dụng R vào công việc
nghiên cứu của mình. Còn nếu chưa có dự án riêng thì có thể học theo
các nghiên cứu đã công bố, đặc biệt là công bố nào có bao gồm cả dữ
liệu và code R của các bước xử lý và phân tích, ví dụ như ở
đây. Trong quá trình
thực hành thì AI như chatgpt/deepseek sẽ có thể là bạn thân của bạn,
giúp bạn học và làm nhanh hơn.