Информационное общество, 2013 год, выпуск 1-2
Ключевые слова и аннотации
Transformation is Always Difficult
Chris Vein
The World Bank strategy must address the needs of potential customers. It will focus on creating an effective set of products and services – this is what the ICT department of the Bank is engaged in. A key element of our business is Open Government. In Russia, given the size of the country and the diversity of its regions, there is a demand for Open Government, so the assistance of the Bank and its experience can be very helpful.
Working in the field of information technology, you come to an understanding of the fact that the reforms are always difficult. There is the problem of the balance between openness and the right to privacy, what kind of data should be publicly available and which of them are not to be made public. Our approach is to develop a clear policy that regulates our day-to-day decisions at the federal level, at the level of a department, a bureau, an office. It helps us to be consistent in determining what data can be publicly available. We depart from the presumption of openness, that is, starting with the conviction that all information should be publicly available. In Russia, there is a very high interest in the idea of open government, people strive to understand what open government is, what it promises and how it should be implemented.
Key words: open government, open data, the presumption of openness and new technologies.
A Data Center as a Scientific and Reference Information Storage Facility
Biktimirov Marat Ramilevich, Vishnyakov Yuri Savvich, Zhizhchenko Alexei Borisovich, Sotnikov Alexander Nikolaevich
The article examines certain aspects of creating a specialized information storage facility taking into account modern trends and approaches to building storage systems and data processing and also the experience gained by the Computing Center of the Russian Academy of Sciences. Particular attention is given to new approaches in ensuring the efficiency of systems throughout their entire life cycle.
Key words: scientific data, storage, processing center, information resource, trusted system, life cycle, IT infrastructure, semantic analysis.
Cloud Computing as a Method of the Effective Organization of Computing Resources in a Scientific Data Processing Center
Konoplev Veniamin Viktorovich, Nazirov Ravil Ravilyevich
The article examines issues of the effective organization of computing resources in a scientific data processing center with the use of cloud computing technologies, in particular, the "infrastructure as a service" paradigm. The article also discusses technological approaches that, with a limited budget, can be used to build solutions with the characteristics of corporate-level systems.
Key words: cloud computing, virtualization, OpenStack, ZFS, Infiniband
Use of Cloud Infrastructure to Analyse MicroRNA Sequencing Data
Kurachenko Anatoly Viktorovich , Zaigrin Igor Vladimirovich, Sharko Fedor Sergeevich, Nedoluzhko Artem Valerievich, Teslyuk Anton Borisovich
Next-generation sequencing (NGS) produces a significant amount of information on the genome or transcriptome of a specific organism, however further processing of this data is not always trivial.
Here we attempted to realize the base algorithm, which uses existing publicly accessible programs and scripts developed by us to process microRNA sequencing data for different organisms.
As an environment to process the data we used the Galaxy platform, which was installed on the virtual cluster under Torque with the Maui job scheduler on the OpenStack cloud.
Key words: microRNA, NGS, Galaxy platform, web tool
Intelligemt System of Thematic Study of Scientific and Technical Information (ISTINA)
Vasenin Valeriy Aleksandrovich, Afonin Sergei Aleksandrovich, Golomazov Denis Dmitrievich, Kozitsyn Aleksandr Sergeevich
This paper gives a description of the Intelligent System of the Thematic Study of Scientific and Technical Information. The aim of the system is to gather, record, classify, store, analyze and provide on a request some basis information describing the results of activity of scientific and educational organizations. It presents a description of the functional capabilities of the system, including the automation of data capture, the display of data in open access, the automatic formation of report materials and statistical and thematic analysis. The paper reviews issues of the use of ontologies to record the specifics of various faculties. It also gives a brief description of the results of implementing the system at Lomonosov Moscow State University involving more than 6800 employees from 750 divisions.
Key words: scientific information, information analysis, publication, unstructured data, automatic data collection, bibliographic links, display of data in open access, Web of Science, information on publications, number of article citations
Multi-Agent Technologies of the Distributed Control of the Grouping of Small Space Earth Remote Sensing Devices
Sollogub Anatoly Vladimirovich, Skobelev Petr Olegovich, Simonova Elena Vitalievna, Tsarev Alexander Vyacheslavovich, Stepanov Maxim Evgenievich, Zhilyaev Alexei Alexandrovich
The approach for distributed real-time control of the grouping of small satellites for Earth remote sensing is presented. Intelligent system based on multi-agent technologies and ontologies using the method of coordinated interaction of mobile agents, in which the tasks and roles of each satellite in the grouping can be changed adaptively according to the current situation, was developed to investigate the methods of collective control of mobile objects in the grouping. To describe the knowledge used by the agents to solve the tasks, ontological approach is used. Results of experimental research of models of group operations of small satellites are presented to demonstrate the advantages of the developed approach.
Key words: Multi-agent technologies, small satellites grouping, intelligent system for satellite grouping control, distributed control, satellites interaction.
User Training for Techniques and Strategies of Information Retrieval through the Use of Differential Features of Information and Retrieval Systems
Vituhnovskaya Alla Alexandrovna
Under existing conditions of the society information resources are becoming more available to a wide range of users. The number of information systems providing access to these resources has considerably increased as well. At the same time the level of information search competency remains relatively low. A technique of teaching information search skills has been worked out by the author. It is based on the application of differential features of information and retrieval systems (IR systems). The article presents a range of values of features for IR systems of various types. All steps of the information search – from the query analysis to the query result – are examined and illustrated by examples. Due to the absence of a special course "Foundations of Information Culture" in many schools and higher educational institutions, the author proposes to introduce a cross-cutting topic "Technology of the Information Search" into the university course "Information Systems".
Key words: Information retrieval, information retrieval systems, differential features, information queries.
Semantic Methods of Structuring Mathematical Content Providing Enhanced Search Functionality
Elizarov Alexander Mikhaylovich, Lipachev Evgeniy Konstantinovich, Hohlov Yuri Evgenyevich
The article presents the technologies of the Semantic Web enabling services with enhanced search functionality to be implemented in electronic scientific collections. There is a special section on mathematical electronic information resources and the specifics of presenting mathematical texts. The article describes the methods of the shared use of electronic collections with a discriminate organization defined by the particular features of using mathematical notation in electronic publications. The article proposes a model of integration of mathematical electronic collections and a set of methods to automatically convert electronic publications using data converter systems, a data schema grouping and also the stylistic entry of data from different collections into one presentation. The article describes the methods of the automatic selection of identifying metadata from scientific publications and the system of generating administrative metadata.
Key words: information society, information and communication technologies, information resources, technologies of the Semantic Web, electronic scientific collections, enhanced search functionality, identifying and administrative metadata, mathematical notation in electronic publications, linked data.
The Use of Open Data in Scientific Research
Radchenko Irina Alexeevna
The article gives definitions of open and linked data. The author refers to the history and background of the development of open data approach and its use and application in scientific research. In order to technically implement the idea of open data the article examines Linked Open Data concept used to publish sets of linked open data.
Keywords: Open Data, Open Science, Open Government Data, Open Science Data, Linked Open Data, Semantic Web, LOD-cloud, Linked Data, RDF
On the Problem of Developing the Information and Communications Infrastructure of the Research Center
Shikota Svetlana Kalikstovna
The article examines the development of the information, computer and telecommunications infrastructure of a research center. It discusses the condition of the infrastructure of certain Russian research centers and strategies for implementing new technologes taking the use of new software and hardware solutions at the RAS Research Center in Chernogolovka as an example.
Key words: information development, scientific research center, information and communication technologies, distributed collaboration systems, software and hardware infrastructure.
About Scientific Activity of Natural Research Organizations in Russia and Abroad
Romanovsky Michael Yuryevich
The quantitative analysis of publications of various natural research organization of the same country is done for the direct comparison of their scientific efficiency. The proposed method of publication activity estimations may answer several questions of the day not only for Russia, for example "Is all science being made in Universities? Who is the face of the Russian science?"
Keywords: scientometrics, publications analysis
Information system for quality review of graduate qualification works
Solodkin Dmitry Leonidovich
A necessary requirement of high quality higher professional education is self-sufficiency of graduate qualification works of students. Currently between one half and one third of all these works bear clear signs of plagiary in Russia. The article proposes to create an information system on the basis of existing "Contextum", "Antiplagiary" and "Exactus Expert" technologies, which would provide free access to interested experts to texts of graduate qualification works, as well as ensure an automated check of these texts on the basis of formal indicators.
Key words: graduate qualification work, plagiary, text borrowing, Exactus Expert, Antiplagiary system, Contextum information technology
Преобразования всегда даются нелегко
Вейн Крис
Стратегия Всемирного банка должна соответствовать потребностям потенциальных клиентов. Предстоит сосредоточиться на создании эффективного комплекса продуктов и услуг - именно этим занимается ИКТ-подразделение банка. Ключевой элемент нашей деятельности - открытое правительство. В России, учитывая масштабы страны и разнообразие ее регионов, есть спрос на открытое правительство, поэтому помощь банка и его опыт могут оказаться очень полезными.
Работая в сфере информационных технологий, приходишь к пониманию того факта, что преобразования всегда даются нелегко. Существует проблема соблюдения баланса между открытостью и правом на частную жизнь, какие данные должны быть общедоступными, а какие не должны предаваться гласности. Наш подход состоит в том, чтобы разработать четкую политику, которая регулирует принимаемые нами из дня в день решения на федеральном уровне, на уровне департамента, бюро, офиса. Это помогает нам быть последовательными, какие данные могут быть общедоступными. Мы исходим из презумпции открытости, то есть начинаем с того, что вся информация должна быть общедоступной. В России очень высокий уровень заинтересованности людей идеей открытого правительства, люди стремятся разобраться, что такое открытое правительство, что сулит его внедрение и как его реализовать.
Ключевые слова: открытое правительство, открытые данные, презумпция открытости, новые технологии.
Дата-центр как хранилище научно-справочной информации
Биктимиров Марат Рамилевич, Вишняков Юрий Саввич, Жижченко Алексей Борисович Сотников Александр Николаевич
Статья посвящена некоторым аспектам создания специализированного хранилища информации с учетом современных тенденций и подходов к построению систем хранения и обработки данных, а также опыта, накопленного в Вычислительном центре Российской академии наук. Особое место уделено новым подходам к обеспечению работоспособности системы в течение всего ее жизненного цикла.
Ключевые слова: научные данные, хранилище, центр обработки, информационный ресурс, доверенная система, жизненный цикл, ИТ-инфраструктура, семантический анализ.
"Вычислительное облако" как средство эффективной организации вычислительных ресурсов в центре
обработки научных данных
Коноплев Вениамин Викторович, Назиров Равиль Равильевич
В статье рассматриваются вопросы эффективной организации вычислительных ресурсов в центре обработки научных данных с применением технологий облачных вычислений, в частности, парадигмы "инфраструктура как сервис". Обсуждаются технологические подходы, которые при ограниченном бюджете позволяют строить решения, обладающие характеристиками систем корпоративного уровня.
Ключевые слова: облачные вычисления, виртуализация, OpenStack, ZFS, Infiniband.
Использование облачной инфраструктуры
для анализа данных секвенирования микроРНК
Кураченко Анатолий Викторович, Заигрин Игорь Владимирович, Шарко Федор Сергеевич, Недолужко Артем Валерьевич, Теслюк Антон Борисович
Секвенирование с использованием технологий next-generation sequencing (NGS) позволяет получать значительное число информации о геноме или транскриптоме конкретного организма, однако дальнейшая обработка этих данных не всегда тривиальна. В данной работе мы попытались реализовать базовый алгоритм, который на основе
существующих общедоступных и разработанных нами программ и скриптов позволит обрабатывать данные секвенирования микроРНК у различных организмов. В качестве среды для проведения обработки данных использована платформа Galaxy, которая была установлена на виртуальный кластер под управлением Torque с планировщиком заданий Maui на базе вычислительного облака OpenStack.
Ключевые слова: микроРНК, секвенирование, NGS, платформа Galaxy, веб-инструмент.
Интеллектуальная система тематического исследования научно-технической информации (ИСТИНА)
Васенин Валерий Александрович, Афонин Сергей Александрович, Голомазов Денис Дмитриевич, Козицын Александр Сергеевич
Настоящая работа посвящена описанию Интеллектуальной Системы Тематического Исследования НАучно-технической информации. Задача системы - сбор, учет, систематизация, хранение, анализ и выдача по запросу информации, характеризующей результаты деятельности научных и образовательных организаций. Представлено описание функциональных возможностей системы, включая автоматизированный ввод данных, отображение их в открытом доступе, автоматическое формирование отчетных материалов, статистический и тематический анализ. Рассмотрены вопросы использования онтологий для учета специфики различных факультетов. Приведена краткая характеристика результатов внедрения системы в МГУ им. М.В. Ломоносова с привлечением более 6800 сотрудников из 750 подразделений.
Ключевые слова: научная информация, анализ информации, публикация, неструктурированные данные, автоматический сбор информации, библиографические ссылки, отображение данных в открытом доступе, Web of Science, информация о публикациях, число цитирования статей
Мультиагентные технологии распределенного управления группировкой малоразмерных космических аппаратов дистанционного зондирования Земли
Соллогуб Анатолий Владимирович, Скобелев Петр Олегович, Симонова Елена Витальевна, Царев Александр Вячеславович, Степанов Максим Евгеньевич, Жиляев Алексей Александрович
Рассматриваются принципы распределенного управления группировкой космических аппаратов дистанционного зондирования Земли в реальном масштабе времени. Для исследования методов коллективного управления подвижными объектами в группировке разработана интеллектуальная система, построенная на основе мультиагентных технологий и онтологий с использованием метода согласованного взаимодействия подвижных агентов, в котором задачи и роли каждого спутника в группе могут адаптивно изменяться в зависимости от ситуации. Для описания знаний, используемых агентами при решении задач, используется онтологический подход.
Приводятся результаты экспериментальных исследований моделей групповых операций малых космических аппаратов, показывающие преимущества разработанного подхода.
Ключевые слова:мультиагентные технологии, кластер малоразмерных космических аппаратов, интеллектуальная система управления группировкой спутников, распределенное управление, взаимодействие между спутниками.
Обучение технологии и стратегии информационного поиска
на основе дифференциальных признаков
информационно-поисковых систем
Витухновская Алла Александровна
В условиях информатизации общества мировые информационные ресурсы становятся все более доступными для широкого круга пользователей, расширяется круг информационных систем, обеспечивающих доступ к ресурсам. Вместе с тем, уровень компетентности в области информационного поиска у школьников и студентов остается низким. Автором разработана методика обучения пользователей технологии поиска информации, основанная на использовании дифференциальных признаков информационно-поисковых систем (ИПС), и представлен перечень значений признаков для ИПС различных видов. В связи с отсутствием во многих школах и высших учебных заведениях специального курса "Основы информационной культуры" автор предлагает в вузовский курс "Информационные системы" включить сквозную тему "Технология информационного поиска".
Ключевые слова: информационный поиск, информационно-поисковые системы, дифференциальные признаки, информационные запросы
Информационная система для анализа качества выпускных квалификационных работ
Солодкин Дмитрий Леонидович
Необходимое условие высокого качества высшего профессионального образования − самостоятельность выпускных квалификационных работ студентов вузов. В настоящее время в России от половины до двух третей таких работ имеют явные признаки плагиата. В статье предлагается создать на базе существующих технологий "Контекстум", "Антиплагиат" и Exactus Expert информационную систему, обеспечивающую свободный доступ заинтересованных экспертов к текстам выпускных квалификационных работ, а также автоматическую проверку этих текстов по ряду формальных показателей.
Ключевые слова: выпускная квалификационная работа, плагиат, текстовое заимствование, Exactus Expert, система "Антиплагиат", информационная технология "Контекстум"