Cách cài đặt Solr 5.2.1 trên Ubuntu 14.04
Solr là một nền tảng công cụ tìm kiếm dựa trên Apache Lucene. Nó được viết bằng Java và sử dụng thư viện Lucene để thực hiện lập index . Nó có thể được truy cập bằng cách sử dụng nhiều API REST, bao gồm cả XML và JSON. Đây là danh sách tính năng từ trang web của họ:Được viết với sự cộng tác của Solr
- Khả năng tìm kiếm toàn văn bản nâng cao
- Được tối ưu hóa cho lưu lượng truy cập web dung lượng lớn
- Giao diện mở dựa trên tiêu chuẩn - XML, JSON và HTTP
- Giao diện quản trị HTML toàn diện
- Thống kê server được hiển thị qua JMX để theo dõi
- Có thể mở rộng tuyến tính, sao chép index tự động, tự động chuyển đổi dự phòng và phục hồi
- Lập index gần thời gian thực
- Linh hoạt và thích ứng với cấu hình XML
- Kiến trúc plugin có thể mở rộng
Trong bài viết này, ta sẽ cài đặt Solr bằng cách sử dụng phân phối binary của nó.
Yêu cầu
Để làm theo hướng dẫn này, bạn cần :
Tối thiểu là một server Ubuntu 14.04 1 GB, nhưng dung lượng RAM cần thiết phụ thuộc nhiều vào tình huống cụ thể của bạn.
Bước 1 - Cài đặt Java
Solr yêu cầu Java, vì vậy trong bước này, ta sẽ cài đặt nó.
Quá trình cài đặt Java hoàn chỉnh được mô tả kỹ trong bài viết này , nhưng ta sẽ sử dụng một quy trình hơi khác.
Đầu tiên, sử dụng apt-get để cài đặt python-software-properties
:
- sudo apt-get install python-software-properties
Thay vì sử dụng các gói default-jdk
hoặc default-jre
, ta sẽ cài đặt version mới nhất của Java 8. Để thực hiện việc này, hãy thêm repository trình cài đặt Java không chính thức:
- sudo add-apt-repository ppa:webupd8team/java
Bạn cần nhấn ENTER
để chấp nhận thêm repository vào index của bạn .
Sau đó, cập nhật danh sách nguồn:
- sudo apt-get update
Cuối cùng, cài đặt Java 8 bằng apt-get. Bạn cần đồng ý với Thỏa thuận cấp phép mã binary của Oracle cho Sản phẩm nền tảng Java SE và JavaFX.
- sudo apt-get install oracle-java8-installer
Bước 2 - Cài đặt Solr
Trong phần này, ta sẽ cài đặt Solr 5.2.1. Ta sẽ bắt đầu bằng cách download bản phân phối Solr.
Đầu tiên, hãy tìm một chiếc gương phù hợp trên trang này . Sau đó, sao chép liên kết của solr-5.2.1.tgz
từ máy nhân bản. Ví dụ: ta sẽ sử dụng http://apache.mirror1.spango.com/lucene/solr/5.2.1/
.
Sau đó, download file trong folder chính của bạn:
- cd ~
- wget http://apache.mirror1.spango.com/lucene/solr/5.2.1/solr-5.2.1.tgz
Tiếp theo, extract file cài đặt dịch vụ:
- tar xzf solr-5.2.1.tgz solr-5.2.1/bin/install_solr_service.sh --strip-components=2
Và cài đặt Solr dưới dạng một dịch vụ bằng cách sử dụng script:
- sudo bash ./install_solr_service.sh solr-5.2.1.tgz
Cuối cùng, hãy kiểm tra xem server có đang chạy không:
- sudo service solr status
Bạn sẽ thấy kết quả bắt đầu bằng:
Found 1 Solr nodes: Solr process 2750 running on port 8983 . . .
Bước 3 - Tạo Bộ sưu tập
Trong phần này, ta sẽ tạo một bộ sưu tập Solr đơn giản.
Solr có thể có nhiều bộ sưu tập, nhưng đối với ví dụ này, ta sẽ chỉ sử dụng một bộ sưu tập. Để tạo một bộ sưu tập mới, hãy sử dụng lệnh sau. Ta chạy nó với quyền là user Solr trong trường hợp này để tránh bất kỳ lỗi quyền nào.
- sudo su - solr -c "/opt/solr/bin/solr create -c gettingstarted -n data_driven_schema_configs"
Trong lệnh này, gettingstarted
là tên của tập hợp và -n
chỉ định tập hợp cấu hình. Có 3 bộ cấu hình được Solr cung cấp theo mặc định; trong trường hợp này, ta đã sử dụng một trường không xác định, nghĩa là bất kỳ trường nào cũng có thể được cung cấp, với bất kỳ tên nào và kiểu sẽ được đoán.
Đến đây bạn đã thêm bộ sưu tập và có thể bắt đầu thêm dữ liệu. Lược đồ mặc định chỉ có một trường bắt buộc: id
. Nó không có các trường mặc định khác, chỉ có các trường động. Nếu bạn muốn xem schemas , nơi mọi thứ được giải thích rõ ràng, hãy xem file /opt/solr/server/solr/gettingstarted/conf/schema.xml
.
Bước 4 - Thêm và truy vấn tài liệu
Trong phần này, ta sẽ khám phá giao diện web Solr và thêm một số tài liệu vào bộ sưu tập của bạn .
Khi bạn truy cập http:// your_server_ip :8983/solr
bằng trình duyệt web của bạn , giao diện web Solr sẽ xuất hiện:
Giao diện web chứa rất nhiều thông tin hữu ích được dùng để gỡ lỗi sự cố nào bạn gặp phải trong quá trình sử dụng.
Các bộ sưu tập được chia thành các lõi, đó là lý do tại sao có rất nhiều tham chiếu đến các lõi trong giao diện web. Ngay bây giờ, bộ sưu tập gettingstarted
chỉ chứa một lõi, có tên là gettingstarted
. Ở phía bên trái, menu kéo xuống Bộ chọn lõi hiển thị, trong đó bạn có thể chọn gettingstarted
để xem thêm thông tin.
Sau khi bạn đã chọn gettingstarted
lõi, chọn Documents. Tài liệu lưu trữ dữ liệu thực mà Solr có thể tìm kiếm được. Bởi vì ta đã sử dụng cấu hình schemaless, ta có thể sử dụng bất kỳ trường nào. Hãy thêm một tài liệu duy nhất với biểu diễn JSON mẫu sau bằng cách sao chép tài liệu bên dưới vào (các) trường Tài liệu :
{ "number": 1, "president": "George Washington", "birth_year": 1732, "death_year": 1799, "took_office": "1789-04-30", "left_office": "1797-03-04", "party": "No Party" }
Nhấp vào Gửi tài liệu để thêm tài liệu vào index . Sau một vài phút, bạn sẽ thấy như sau:
Status: success Response: { "responseHeader": { "status": 0, "QTime": 509 } }
Bạn có thể thêm nhiều tài liệu hơn, có cấu trúc tương tự hoặc hoàn toàn khác, nhưng bạn cũng có thể tiếp tục chỉ với một tài liệu.
Bây giờ, chọn Query ở bên trái để truy vấn tài liệu mà ta vừa thêm vào. Với các giá trị mặc định trong màn hình này, sau khi nhấp vào Thực thi Truy vấn , bạn sẽ thấy tối đa 10 tài liệu, tùy thuộc vào số lượng bạn đã thêm:
{ "responseHeader": { "status": 0, "QTime": 58, "params": { "q": "*:*", "indent": "true", "wt": "json", "_": "1436827539345" } }, "response": { "numFound": 1, "start": 0, "docs": [ { "number": [ 1 ], "president": [ "George Washington" ], "birth_year": [ 1732 ], "death_year": [ 1799 ], "took_office": [ "1789-04-30T00:00:00Z" ], "left_office": [ "1797-03-04T00:00:00Z" ], "party": [ "No Party" ], "id": "1ce12ed2-add9-4c65-aeb4-a3c6efb1c5d1", "_version_": 1506622425947701200 } ] } }
Kết luận
Có nhiều tùy chọn khác có sẵn, nhưng bây giờ bạn đã cài đặt thành công Solr và có thể bắt đầu sử dụng nó cho trang web của bạn .
Các tin liên quan
Cách cài đặt và cấu hình Riak2 với Python3 trên Ubuntu 14.042015-07-14
Cách thiết lập R trên Ubuntu 14.04
2015-07-13
Cách triển khai ứng dụng Rails với Git Hooks trên Ubuntu 14.04
2015-07-09
Cách sử dụng Prometheus để giám sát server Ubuntu 14.04 của bạn
2015-06-30
Cách cài đặt control panel Ajenti và Ajenti V trên Ubuntu 14.04
2015-06-26
Cách tự động hóa cài đặt WordPress trên Ubuntu 14.04 bằng Ansible
2015-06-25
Cách cài đặt Công cụ giám sát Munin trên Ubuntu 14.04
2015-06-20
Cách cài đặt và cấu hình mod_deflate trên Ubuntu 14.04
2015-06-17
Cách cài đặt MongoDB trên Ubuntu 14.04
2015-06-15
Cách cài đặt và sử dụng ArangoDB trên Ubuntu 14.04
2015-06-12