Thứ Năm, 30 tháng 12, 2010

Đối ngoại của EU xuất bản các công cụ khai phá dữ liệu sống còn như nguồn mở

EU External Affairs publishes crisis data mining tools as open source

by Gijs Hillenius — published on Dec 23, 2010

— filed under: Statistical Open Source Software, Statistics, [GL] EU and Europe-wide, gis-software-community, eupl-community, Statistical Analysis, [T] Deployments and Migrations, geographic information systems, European Union Public License (EUPL)

Theo: http://www.osor.eu/news/eu-external-affairs-publishes-crisis-data-mining-tools-as-open-source

Bài được đưa lên Internet ngày: 23/12/2010

Phòng về khủng hoảng tại Ban Tổng giám đốc về Quan hệ đối ngoại của Liên minh châu Âu đã xuất bản vài công cụ khai phá dữ liệu (data mining) nguồn mở, nghĩa là để cung cấp hỗ trợ thời gian thực cho việc cảnh báo và phản ứng với khủng hoảng.

Công cụ chính, Tariqa, phiên bản 3.0, là một nền tảng tìm kiếm nguồn mở mà sử dụng và kết hợp thông tin từ các máy tìm kiếm, các cơ sở dữ liệu thông tin và các nguồn thông tin địa lý bao gồm cả các ảnh vệ tinh. “Các công cụ trích tìm thông tin tiên tiến của Tariqa làm cho có khả năng giành được tri thức hữu dụng từ nhiều thông tin mà đang có sẵn”, các lập trình viên viết trong giới thiệu của họ.

Tên của dự án là một khái niệm Sufi mà theo tiếng Ả rập có nghĩa là “con đường” hoặc “cuộc du ngoạn ban đầu” nhưng cũng có thể có nghĩa là “tình anh em” hoặc “cộng đồng”.

Tariqa ban đầu đã được công bố trên OSOR mùa hè này. Tuy nhiên, những người sử dụng được nhắm tới, các nhà quản trị dân sự tại Ủy ban châu Âu, đã bắt đầu sử dụng nó hôm thứ sáu, ngày 10/12, và phần mềm này đã được làm cho sẵn sàng một cách công khai đầu tuần này.

DG về các quan hệ đối ngoại đã muốn chắc chắn dự án này có thể được tung ra theo giấy phép công cộng của Liên minh châu Âu, EUPL. “Về những thành phần của ứng dụng sử dụng thư viện MySQL-C, mà Oracle sở hữu”, Pascal Havelange, một trong những lập trình viên chính của Tariqa, giải thích. Hãng phần mềm ứng dụng cơ sở dữ liệu này đã trả lời một cách tích cực vào cuối tuần. “Chúng tôi có thể sử dụng EUPL cũng cho thành phần này, nhưng sẽ bổ sung một lưu ý cho các dự án dẫn xuất trong tương lai”.

The crisis room at the European Union's Directorate-General for External Relations has published several open source data mining tools, meant to provide real-time support for early warning and crisis response.

The main tool, Tarîqa, version 3.0, is an open source search platform that uses and combines information from search engines, information databases and geographic information sources including satellite images. "Tarîqa's advanced information retrieval tools makes it possible to gain useful knowledge from the masses of information that are available", the developers write in their introduction.

The project name is a Sufi term which in Arabic means the 'path' or the 'initiation voyage' but can also mean 'brotherhood' or 'the community'.

Tarîqa was originally announced on OSOR this summer. However, the targeted users, civil administrators at the European Commission, began using it on Friday 10 December, and the software was made publicly available earlier this week.

The DG for External Relations wanted to make sure the project could be released under the European Union's public licence, the EUPL. "One of the components of the application uses the MySQL-C library, owned by Oracle", explains Pascal Havelange, one of the main developers of Tarîqa. The database application software firm replied positively last week. "We can use EUPL also for this component, but will add a remark for future derivate projects."

Độc lập với nền tảng

Tariqa được phát triển có sử dụng các thành phần nguồn mở là chính, bao gồm ngôn ngữ scripting cho máy chủ web là PHP5, máy chủ web nguồn mở Apache. Nó đang sử dụng cơ sở dữ liệu nguồn mở MySQL cho việc lưu trữ của mình. Một số phần của phần mềm được viết bằng C#, một ngôn ngữ lập trình sở hữu độc quyền, bản thân ứng dụng này có thể được sử dụng trong một trình duyệt web trên bất kỳ nền tảng nào. Điều này làm cho giải pháp có hiệu quả về chi phí, các lập trình viên viết: “Tất cả điều chúng tôi cần để bắt đầu sử dụng Tariqa là một trình duyệt web”.

Công việc trên Tariqa đã bắt đầu khoảng năm 2001 bởi Andrea Ricci, một chuyên gia về ngăn ngừa xung đột, người xũng đã thiết kế và quản lý phòng về khủng hoảng tại EU DG về các quan hệ đối ngoại. Các phiên bản đầu đã dựa vào HTML, bắt đầu với phiên bản 1.5, Tariqa đã bắt đầu sử dụng PHP và MySQL.

“Sự phát triển của phần bản 2.0 đã bắt đầu vào năm 2006. Nó đã bổ sung thâm các scripts CGI, trong C++, để chia tách mã nguồn của website từ mã nguồn tương tác với các nhà cung cấp phát triển mới của Tariqa 3.0 được bắt đầu trong năm 2010, đã thấy việc thay thế nhiều CGI bằng Dịch vụ web dựa trên PHP, để cải thiện hiệu năng và giảm tải trên phía máy chủ. Nó đã được phát triển có sử dụng PHP5, cho phép tiếp cận hướng đối tượng đầy đủ. Nó cũng mang tới những tính năng mới hoàn toàn, chủ yếu về cộng tác giữa những người sử dụng đầu cuối, mã nguồn AJAX cùng với các Dịch vụ .NET của Windows để giảm thiểu thời gian trả lời”.

2 công cụ khác được xuất bản mùa hè này bởi DG cho những quan hệ đối ngoại là Mdownloader, một công cụ tải về, và Maggregator, một công cụ để tổng hợp các thông tin RSS feed. Những công cụ này cũng được viết bằng C#, Havelange nói: “Chúng tôi không có sự lựa chọn về hệ điều hành mà chúng tôi sử dụng cho sự phát triển và đó là vì sao mọi thứ được làm chủ yếu cho một hệ thống sở hữu độc quyền”.

Havelange đã viết một phiên bản trước đó của Mdownloader có sử dụng C++ và libcurl. “Điều này có thể đã chuyển được sang Linux một cách dễ dàng. Việc sử dụng các công cụ C# nguồn mở có sẵn trong dự án Mono, phiên bản hiện hành có thể trong tương lai được chuyển sang nền tảng đó”.

Platform independent

Tarîqa is developed using mainly open source components, including web server scripting language PHP5, the open source Apache web server. It is using the open source MySQL database for its internal storage. Some parts of the software is written in C#, a proprietary programming language, the application itself can be used in a web browser on any platform. This makes the solution cost-effective, the developers write: "All you need to begin using Tarîqa is a web browser."

Work on Tarîqa started began around 2001 by Andrea Ricci, an expert in conflict prevention, who also designed and manages the crisis room at the EU DG for External Relations. The first versions were based on plain HTML, starting with version 1.5, Tarîqa started using PHP and MySQL.

"The development of version 2.0 started in 2006. It added CGIs scripts, in C++, in order to split the code of the website from the code interacting with the news providers Development of Tarîqa 3.0 started in 2010, saw the replacing of the multiple CGIs by one PHP-based Web Service, in order to improve performances and reduce the workload on the server side. It has been developed using PHP5, allowing full Object Oriented approach. It also brings brand new features, mainly for collaboration between end-users, AJAX code together with .NET Windows Services to reduce the response times."

Two other tools published this summer by the DG for External Relations are Mdownloader, a download tool, and Maggregator, a tool to aggregate RSS feeds. These tools are also written in C#. Havelange: "We do not have a choice for the operating system we use for development, and that is why everything is made mainly for a proprietary system."

Havelange wrote a previous version of Mdownloader using C++ and libcurl. "This could have been ported to Linux easily. Using the open source C# tools made available in the Mono project, the current version could in the future be ported to that platform."

Dịch tài liệu: Lê Trung Nghĩa

letrungnghia.foss@gmail.com

Không có nhận xét nào:

Đăng nhận xét

Lưu ý: Chỉ thành viên của blog này mới được đăng nhận xét.