Tôi đã Xây Dựng Một Phần Mềm Mã Nguồn Mở Như Thế Nào
Lưu ý trước khi đọc tiếp: Ở bài viết này tác giả dùng chữ “hacker”, không phải theo nghĩa chỉ những người làm trong lĩnh vực bảo mật hay an toàn thông tin. “Hacker” ở đây là những kỹ sư, những nhà phát triền có năng lực tự tìm hiểu, mày mò, có kỹ năng “bắt máy tính phục vụ sở thích của mình”.
Ý tưởng
Nếu bạn là một hacker làm việc nhiều với Mac hoặc Linux, chắc các bạn chẳng xa lạ gì với terminal - giao diện dòng lệnh cơ bản nhất của hệ điều hành Unix. Tôi là một hacker bị “cuồng terminal”, zsh
, prezto
, tmux
, irssi
, vim
, tig
là những tools ưa thích nhất. Tôi từng có ước mơ muốn từ bỏ các giao diện đồ hoạ, có thể lập trình, chat chit, nghe nhạc v.v.. ngay trên môi trường không-đồ-hoạ.
Bên cạnh đó, mặc dù không mấy mặn mà với Facebook nhưng gần đây lại bị nghiện Twitter, trong đầu tôi luôn hiện lên câu hỏi: làm thế nào để cũng có thể tương tác với Twitter chỉ qua terminal của MacOSX ?
Trên thực tế đã có khá nhiều thư viện mã nguồn mở có thể đáp ứng được nhu cầu trên. t hay earthquake là những gem(Ruby) được viết rất bài bản và đa tính năng. Tuy nhiên tôi đã quyết định tự viết một phần mềm của riêng mình, bởi tự phát triền và làm sản phẩm của mình được cộng đồng đón nhận là một mục tiêu mới mẻ và đầy thử thách.
Trong bài viết này, tôi sẽ giới thiệu với các bạn tôi đã xây dựng một phần mềm mã nguồn mở như thế nào, về cả kỹ năng phát triển và cách mang phần mềm của mình đến với cộng đồng hacker trên thế giới.
Xác định mục tiêu
Khi bạn bắt đầu viết một phần mềm mã nguồn mở, điều quan trọng đầu tiên sẽ là : đã có ai thực hiện ý tưởng của bạn chưa và họ đã thực hiện được tốt đến đâu. Khi chuẩn bị viết phần mềm của mình, tôi nhận thấy t giống như 1 twitter command trên Unix, focus vào khả năng pipe với các command khác. Ngược lại, earthquake là 1 app hoàn chỉnh nhưng xử lý hiển thị tweets lại chưa thật tốt.
Và từ đó Rainbow Stream ra đời. Bạn có thể nhận ra 2 điểm nêu trên khi nhìn vào cách thức hoạt động của app dưới đây:
Tạo nên sự khác biệt
Để gây được ấn tượng với người dùng, sản phẩm của bạn vẫn cần có 1 đến 2 tính năng nổi trội. Bạn sẽ không muốn phần mềm mình viết ra mãi chỉ là “alternative to xxx or yyy, can consider if zzz stops development”. Ở đây, tôi xây đựng Rainbow Stream tập trung vào 2 tính năng chính:
- Khả năng hiển thị màu sắc trên các terminal hỗ trợ 256 màu, cung cấp sẵn 1 số themes nổi tiếng.
- Hiện thị ảnh trực tiếp trên terminal.
Chúng ta sẽ đi vào cụ thể trong các phần tiếp theo.
Hiển thị màu của terminal
Hầu hết các terminal hiện đại đều hỗ trợ hiển thị 256 ANSI colors. Trên shell bạn có thể dễ dàng in ra chữ theo các màu định sẵn bẳng các dùng Escape character như dưới đây
1 2 3 4 5 6 7 |
|
Hiện thị màu trên Python có thể được viết gọn theo function như sau
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 |
|
Sử dụng những function ở trên thực tế rất đơn giản: gọi thẳng function với parameter là mã ANSI color, trả về là một function khác và lần này nhận parameter là string để đổi thành string có màu tương ứng.
1 2 3 4 5 6 7 8 9 10 |
|
Giả sử chúng ta có một tập vô hạn các word không biết trước. muốn mỗi word có một màu và các word lặp lại sẽ có màu giống nhau, chúng ta có thể dùng Memoization trong Python như sau:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 |
|
Các màu sắc hiển thị trong Rainbow Stream đều dựa theo nguyên lý nói trên.
Hiển thị ảnh trên terminal
Để nói cụ thể về phần này sẽ hơi dài dòng, nhưng có thể tóm gọn trong các ý sau đây:
- Python có một thư viện xử lý ảnh rất tốt là
Pillow
.Pillow
cung cấp những tính năng cơ bản để thao tác với lượng thông tin trong một tấm ảnh. Nhược điểm của Pillow là khá buggy khi install và không hỗ trợ Window. - Tôi dùng
Pillow
để đọc thông tin về từng Pixel trong một ảnh, mỗi pixel sẽ có 4 chỉ số gồm 3 chỉ số màu (R,G,B) và 1 chỉ số về độ trong (A). - Màu sắc của 1 pixel nói trên được quy đổi về tập 256 màu ANSI hiển thị được trên terminal (phương pháp xem ở dưới).
- Với mỗi pixel, tôi in ra như 1 ký tự Space với màu ANSI tương ứng, sử dụng hàm
term_color
ở đoạn trên.
Trong các bước trên thì bước quy đổi màu là quan trọng nhất. Thuật toán quy đổi dùng ở đây là phương pháp tính khoảng cách vector trong không gian Euclide 3 chiều:
- Mỗi màu RGB coi như 1 vector với 3 chiều là R (Red), G (Green), B (Blue).
- Mỗi màu ANSI (trong tập 256 màu của terminal) cũng tương ứng với 1 vector 3 chiều. Chúng ta có tập tiêu chuẩn 256 vector ở đây.
- Mỗi vector RGB của 1 pixel sẽ được quy về vector tiêu chuẩn ANSI gần nhất. Công thức tính khoảng cách giữa 2 đầu vector như trong hình học 3 chiều :
((x1-x2)**2 + (y1-y2)**2 + (z1-z2)**2)**0.5
Như vậy “ảnh” ở trên terminal thực chất là các ký tự Space với màu ANSI đã được quy đổi và in ra liên tiếp :)
Các vấn đề kỹ thuật khác
Để hoàn thiện Rainbow Stream thực ra cần một số kỹ năng khác như lập trình với thread, tạo interactive input bẳng readline, gọi chương trình C compile sẵn hay xử lý chung cho cả Python 2 và Python 3… Trong khuôn khổ một bài viết tôi khó có thể trình bày hết những vấn đề trên, vì vậy nếu bạn quan tâm hãy mở thẳng Github repo và đọc source code. Rainbow Stream là một phần mềm mã nguồn mở với MIT license.
(… còn tiếp - Làm thế nào để mang phần mềm của mình đến với thế giới hacker …)