Электронный архив
Донецкого национального технического университета (г.Донецк)
Electronic archive of Donetsk national technical university (Donetsk)
 

eaDonNTU, Donetsk >
Научные труды ДонНТУ >
Серія: Обчислювальна техніка та автоматизація >
Випуск 2 (27) >

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://ea.donntu.ru/handle/123456789/29124

Название: Організація великих даних у розподіленому середовищі
Другие названия: Организация крупных данных в распределенной среде
Big data organizing in a distributed environment
Авторы: Шаховська, Н.Б.
Болюбаш, Ю.Я.
Верес, О.М.
Shakhovska, N.B.
Bolubash, Yu.Ja.
Veres, O.M.
Ключевые слова: big data
information products
data space
великі дані
інформаційні продукти
простір даних
большие данные
информационные продукты
пространство данных
Дата публикации: 2014
Издатель: ДонНТУ
Библиографическое описание: Наукові праці Донецького національного технічного університету. Серія: Обчислювальна техніка та автоматизація. №2 (27) / ДВНЗ "ДонНТУ" ; редкол.: О.А. Мінаєв та ін. - Донецьк : ДонНТУ, 2014. - 230с.
Аннотация: У статті наведено поняття терміну Великі дані та проаналізовано причину іх появи. Визначено причини використання NoSQL та інших нереляційних засобів зберегання даних. Описано простір даних як технологію роботи з Великими даними.
Описание: This paper introduced the concept of the term Big Data and analyzes the cause of their appearance. Big Data is a set of methods and tools for processing different types of structured and unstructured data dynamic large amounts for their analysis and use of decision support . There is an alternative to traditional database management systems and solutions class Business Intelligence. To this class belong the parallel data processing means (NoSQL, algorithms MapReduce, Hadoop). Defining characteristic for Big data is the amount (volume, in terms of volume size ), speed (velocity in terms of both growth rate and the need for high-speed processing and the results), diversity (variety, in terms of the possibility of simultaneous processing of different types of structured and semi-structured data). One of the technologies that should be used for large data region is the data space available. Data space is a block vector containing a set of information products subject divided into three categories: structured data (databases, data warehouses), semi-structured data (XML, spreadsheets) and unstructured data (text). Above this vector and its individual elements there are defined operations and predicates. There is posted the federated information model describes the data warehouse and its components. The features use non-relational NoSQL and other means of storage are described. We describe the data space as the technology of working with large data. The levels of physical model data space are given.
URI: http://ea.donntu.org/handle/123456789/29124
Располагается в коллекциях:Випуск 2 (27)

Файлы этого ресурса:

Файл Описание РазмерФормат
Shakhovska.pdf661 kBAdobe PDFПросмотреть/Открыть

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.