eaDonNTU, Donetsk >
Научные труды ДонНТУ >
Серія: Обчислювальна техніка та автоматизація >
Випуск 2 (27) >
Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://ea.donntu.ru/handle/123456789/29124
|
Название: | Організація великих даних у розподіленому середовищі |
Другие названия: | Организация крупных данных в распределенной среде Big data organizing in a distributed environment |
Авторы: | Шаховська, Н.Б. Болюбаш, Ю.Я. Верес, О.М. Shakhovska, N.B. Bolubash, Yu.Ja. Veres, O.M. |
Ключевые слова: | big data information products data space великі дані інформаційні продукти простір даних большие данные информационные продукты пространство данных |
Дата публикации: | 2014 |
Издатель: | ДонНТУ |
Библиографическое описание: | Наукові праці Донецького національного технічного університету. Серія: Обчислювальна техніка та автоматизація. №2 (27) / ДВНЗ "ДонНТУ" ; редкол.: О.А. Мінаєв та ін. - Донецьк : ДонНТУ, 2014. - 230с. |
Аннотация: | У статті наведено поняття терміну Великі дані та проаналізовано причину іх появи. Визначено причини використання NoSQL та інших нереляційних засобів зберегання даних. Описано простір даних як технологію роботи з Великими даними. |
Описание: | This paper introduced the concept of the term Big Data and analyzes the cause of their appearance. Big Data is a set of methods and tools for processing different types of structured and unstructured data dynamic large amounts for their analysis and use of decision support . There is an alternative to traditional database management systems and solutions class Business Intelligence. To this class belong the parallel data processing means (NoSQL, algorithms MapReduce, Hadoop). Defining characteristic for Big data is the
amount (volume, in terms of volume size ), speed (velocity in terms of both growth rate and the need for high-speed processing and the results), diversity (variety, in terms of the possibility of simultaneous processing of different types of structured and semi-structured data). One of the technologies that should be used for large data region is the data space available. Data space is a block vector containing a set of information products subject divided into three categories: structured data (databases, data warehouses), semi-structured data (XML, spreadsheets) and unstructured data (text). Above this vector and its individual elements there are defined operations and predicates. There is posted the federated information model describes the data warehouse and its components. The features use non-relational NoSQL and other means of storage are described. We describe the data space as the technology of working with large data. The levels of physical model data space are given. |
URI: | http://ea.donntu.org/handle/123456789/29124 |
Располагается в коллекциях: | Випуск 2 (27)
|
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.
|