Plan du site  
français  English
pixel

Blog du campus SUPINFO Grenoble

Présentation du « Big Data » par Ali (Master 2)

Publié le 14 février 2017 dans Témoignages

 

I. Definition

 
Créé par les géants du web, le Big Data se présente comme une solution dessinée pour permettre à tout le monde d’accéder en temps réel à des bases de données géantes. La notion de big data est un concept s’étant popularisé dès 2012 pour traduire le fait que les entreprises sont confrontées à des volumes de données (data) à traiter de plus en plus considérables et présentant de forts enjeux commerciaux et marketing. Le concept de big data n’est pas propre au commerce ou au marketing, mais le développement du commerce électronique et du marketing digital ont joué un rôle important dans la mise en évidence de la problématique du big data. Ce sont en effet des secteurs qui par nature génèrent d’énormes volumes de données à traiter.

 

II. Exemples concrêts de l’applications du Big Data

 

1. Prédiction des conflits mondiaux

L’outil GDELT (Global Database of Events, Languages and Tones), développé par l’université de Georgetown et accessible de manière open source, compile toutes les actualités (communiqués de presse, articles, discours…) parues depuis 1979. Il applique ensuite des techniques d’analyse sémantique et des algorithmes auto-apprenants pour faciliter la compréhension des événements récents et des principes de cause à effet pour arriver à prédire les conflits mondiaux.

2. Gestion des catastrophes naturelles

En utilisant des outils de tracking, d’analyse sémantique et de visualisation en temps réel, l’Organisation Mondiale de la Migration a pu assister les forces locales en dégageant les urgences sanitaires, la localisation des ressources clés et en optimisant l’allocation des ressources sur le terrain lors du typhon qui a frappé les Philippines en 2013

3. Éradication des épidemies

Des scientifiques de l’université de Bringhma Youns essaient de simuler la localisation des mouches tsé-tsé dans le but d’aider à contrôler la propagation d’épidémises. De la même manière, la police de Chicago utilise le Big Data et la visualisation de données pour contrôler les populations de rats dans la ville.

4. Domaine de la santé (recherche contre le cancer)

Project Data Sphere met à disposition de tous des données de tests cliniques passés pour permettre à chacun de conduire ses propres analyses, et, dans l’esprit du Crowd-Innovation, d’améliorer les méthodes ou de découvrir des corrélations encore inconnues.

 

III. Les technologies de big data

 

1. Des bases de données NoSQL (comme MongoDB, Cassandra ou Redis)

Qui implémentent des systèmes de stockage considérés comme plus performants que le traditionnel SQL pour l’analyse de données en masse (orienté clé/valeur, document, colonne ou graphe).

2. Des infrastructures de serveurs

Pour distribuer les traitements sur des dizaines, centaines, voire milliers de noeuds. C’est ce qu’on appelle le traitement massivement parallèle. Le framework Hadoop est sans doute le plus connu d’entre eux. Il combine le système de fichiers distribué HDFS, la base NoSQL HBase et l’algorithme MapReduce. D’autres technologies visant à tendre vers des traitements plus « temps réel » ont émergé dans la foulée (c’est le cas d’Apache Spark)

3. Le stockage des données en mémoire (Memtables)

Permet d’accélérer les temps de traitement des requêtes.

 

IV. Architecture d’un système de big data avec le framework Map-Reduce

bg

Sources : http://www.memoireonline.com/05/14/8890/Big-data-rapport-de-stage.html

Ali (Etudiant en Master 2)

Rencontrez SUPINFO Grenoble

Rencontrez-nous à l'occasion des Journées Portes-Ouvertes (JPO) organisées dans l'ensemble des campus SUPINFO en France et dans le monde.

Rencontrez SUPINFO Grenoble

Contactez SUPINFO Grenoble

Vous avez besoin d'informations complémentaires sur l'établissement ? Vous désirez parler à une conseillère d'orientation ou obtenir une adresse régionale ?

Contactez SUPINFO Grenoble
A propos de SUPINFO | Contacts & adresses | Conditions d'utilisation & Copyright | Respect de la vie privée
Logo de la société Cisco, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société IBM, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société Sun-Oracle, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société Apple, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société Sybase, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société Novell, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société Intel, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société Accenture, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société SAP, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société Prometric, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société Toeic, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo du IT Academy Program par Microsoft, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management

SUPINFO International University
Ecole d'Informatique - IT School
École Supérieure d'Informatique de Paris, leader en France
La Grande Ecole de l'informatique, du numérique et du management
Fondée en 1965, reconnue par l'État. Titre Bac+5 certifié au niveau I.
SUPINFO International University is globally operated by EDUCINVEST Belgium - Avenue Louise, 534 - 1050 Brussels