Khi học về Reinforcement Learning, có 1 cặp khái niệm mà mình thấy rất hứng thú. Đó là trade-off giữa Exploitation vs Exploration (khai thác vs khám phá)

Exploitation có thể xem như tận dụng tất cả kinh nghiệm, kiến thức sẵn có thể dự đoán cho nước đi tiếp theo. Còn Exploration thiên về thực hiện các bước đi lạ, không theo khuôn khổ trước đó với hy vọng sẽ cho ra kết quả tốt hơn. Thông thường, tỉ lệ Exploitation sẽ cao hơn Exploration.

Nếu chỉ có Exploitation, ta sẽ đi vào lối mòn cũ, không bức phá được, cũng không phát triển thêm được và rồi cũng sẽ bị đào thải.

Còn nếu chỉ có Exploration thì cái gì cũng biết, nhưng lại không có cái gì thật sự biết. Cũng ko làm nên trò trống gì.

Khi áp dụng vào công việc, theo tôi, tỉ lệ 80/20 là hợp lý. 80% thời gian sẽ tập trung vào Exploitation, khai thác tối đa chuyên môn, điểm mạnh. Nhưng 20% thời gian còn lại dành cho Exploration, khám phá những công nghệ mới, các ngành nghề liên quan tới công việc chính, dự trù cho các bước đi khác trong tương lai.

Chỉ mới là ý nghĩ trong đầu, cũng ko biết có hiệu quả hay không 😂😂😂