The NeceMoon | November 2010

Visualisation de données: Cartes thématiques VS Graphiques à bulles

by necemon 20. November 2010 21:47

 

Nous avons choisi d'étudier la visualisation cartographique et les graphiques à bulles, parce qu'ils avaient été les visualisations les plus fascinantes au long de cette étude. Nous allons comparer ces deux types sur de nombreux facteurs.

 

Définir les visualisations

 

Une carte thématique est un type de carte ou un graphique spécialement conçu pour montrer un thème particulier lié à une zone géographique spécifique. Ces cartes peuvent dépeindre les aspects physiques, sociaux, politiques, culturels, économiques, sociologiques, agricoles, ou tout autre aspect d'une ville, état, région, nation ou continent.

 

Un exemple de carte est indiqué ci-dessous. Celle ci montre la répartition des étudiants de premier cycle en arts créatifs/conception au Pays de Galles.

 

 

Un graphique en bulles est un type de graphique où chaque entité représentée est définie en termes de trois paramètres numériques distincts. Les graphiques à bulles peuvent faciliter la compréhension des facteurs sociaux, économiques,médicaux, scientifiques et autres relations.

Un exemple de graphique en bulles est indiqué ci-dessous. Celui ci montre la répartition des étudiants en maîtrise, dans l'ensemble du Royaume-Uni, selon leurs champs d'étude et leurs origines.

 

 

 

Ceci est une étude comparative de deux types particuliers de techniques de visualisation.

 

Expression de l'information

Les deux visualisations peuvent transmettre l'information assez bien, mais la visualisation basée sur la carte est limitée à des structures spatiales. Comme mentionné ci-dessus, il peut être utilisé pour décrire les données relatives aux lieux (villes, états, régions, nations ou continents). De l'autre côté, les graphiques à bulles peuvent transmettre des informations de toute nature. En plus, ils peuvent véhiculer de nombreux types d'informations à la fois.

 

Découverte de la déviation, la hiérarchie, la relation et l'association 

Les cartes montrent bien les relations entre les lieux et l'association entre les régions. elles sont aussi bonnes pour comparer 2 endroits basés sur un critère précis.

 

Les graphiques à bulles sont bien pour les comparaisons ausi car ils permettent de montrer beaucoup de choses différentes à la fois. En outre, les cercles peuvent eux memes contenir d'autres données. Cette imbrication peut aider à comprendre la hiérarchie quand c'est necessaire.

 

Représentation de données à différentes échelles

 

Les graphiques à bulles sont particulièrement utiles pour les ensembles de données avec des dizaines voire des centaines de valeurs, ou avec des valeurs qui diffèrent de plusieurs ordres de grandeur. Ils peuvent montrer de façon lisible les valeurs des données qui diffèrent par un ratio de 100 000, et peut afficher des centaines de valeurs individuelles à la fois.

 

Toutefois, les cartes ne sont pas toujours efficaces pour afficher les données énormes et / ou complexes. Le problème est que certaines régions de la carte peuvent être trop reduites pour supporter certaines complexités. Il est vrai que nous pouvons zoomer, mais si les régions sont trop éloignées les unes des autres, le zoom, quelque part nous faire manquer une autre partie importante des données. Nous pouvons alors dire que les cartes ne fournissent pas vraiment un niveau approfondi en termes de détails.

 

 

 Facilité d'utilisation et de compréhension

 

Les cartes sont vraiment intuitives, facile à apprendre, à utiliser et à comprendre, même pour des profanes. En fait, nous utilisons des cartes depuis longtemps,  à l'école primaire au cours de géographie par exemple.

 

 Les graphiques a bulles par contre sont assez inhabituels pour les profanes. En plus, ils peuvent etre assez déroutant et difficile à comprendre quand ils contiennent beaucoup de données.

 

Look and feel

 

Les deux visualisations sont estetiquement agréables à visualiser, surtout quand on utilise des couleurs pour montrer les différences entre deux catégories.Nous pouvons également utiliser des bulles sur les cartes, et la taille des bulles rendent évident quelle partie de la carte est le plus importante, plus grande, etc

 

Conclusion 

Les cartes thématiques sont d'excellents outils qui communiquent les informations à tous. Cependant, elles ne s'appliquent que dans un contexte d'espace. Par ailleurs, elles ont de la peine de traiter des données complexes.

 

D'autre part, les graphiques à bulles sont un peu plus difficiles à gérer mais ils sont vraiment puissants, ils peuvent traiter tout type de données quelle que soit l'échelle.

 

Alors les cartes sont bonnes pour représenter des données simples et spatiales tandis que les graphiques à bulles sont mieux pour représenter les données les plus composés.

 

Tags: , ,

Francais | Technical

Data Visualisation : Thematic Maps VS Bubble Charts

by necemon 20. November 2010 02:17

 

this study is a comparative study of two particular types of visualization techniques in detail.

We chose to study the map-based visualization and the bubble charts because they had been the most fascinating visualizations throughout this study. We are going to compare those two types on many factors.

       Defining the visualizations

A thematic map is a type of map or chart especially designed to show a particular theme connected with a specific geographic area. These maps can portray physical, social, political, cultural, economic, sociological, agricultural, or any other aspects of a city, state, region, nation or continent.

An example of map is shown below. It shows the repartition of undergraduate students studying creative arts and design in Wales.

 

 

A bubble chart is a type of chart where each plotted entity is defined in terms of three distinct numeric parameters. Bubble charts can facilitate the understanding of the social, economical, medical, and other scientific relationships.

An example of bubble chart is shown below. It shows the repartition of master students, in the whole UK, according to their fields of study and origins

 

      Expression of the information

Both visualizations can convey the information pretty well to the viewer but the map based visualization is limited to spatial patterns. As mentioned above, it can be used to describe data related to places (cities, states, regions, nations or continents). On the other side, bubble charts can convey information of any nature. Further, they can convey many different kind of information at a time.

 

        Discovery of deviation, hierarchy, relationship and association

The maps show well the relationships between places and the association among regions. They are also good for comparing 2 places based on a specific criterion.

The bubble charts are good for comparison too since they allow to show many different things at a time. Further, the circles can contain inside them some more data. This nesting can help understanding hierarchy when it occurs.

 

      Depiction of data at different scales

Bubble charts are especially useful for data sets with dozens to hundreds of values, or with values that differ by several orders of magnitude. They can legibly show data values that differ by a ratio of 100,000, and can display hundreds of individual values at once (according to many eyes).

However the maps are not always efficient to display huge and/or complex data. The problem is that some regions on the map can be very small and they just don’t fit to add some complexity or some advanced charts. It’s true that we can zoom, but if regions are too far apart from others, zooming somewhere make us miss another important part of the data. We can then say that maps don’t really provide much level of details.

 

 

      Ease of use and understanding

Maps are really intuitive, easy to learn, to use and to understand, even to lay persons. Actually we had been using maps for ages, at primary school during the geography lectures for example.

 Bubbles charts on the other hand are quite unusual to lay persons. Further, they can quite confusing and difficult to understand when they contain a lot of data.

 

        Look and feel

Both the visualizations are atheistically pleasing to visualize, especially when we use colours to demonstrate the differences between two categories. We can also use bubbles on maps, and the sizes of the bubbles make obvious which part of the map is the bigger, greater, etc.

 

       Conclusion

Thematic maps are great tools that communicate the information well to everyone. However they only apply in a context of space. Further, they hardly deal with complex data.

On the other hand, bubble charts are a bit more difficult to handle but they are really powerful, they can handle any kind of data whatever the scales.

And also some data may not be displayed properly if not spelled as in the map.

So maps are good to represent simple and spatial data whereas bubble charts are better for representing the most compound data.

 

Tags: , ,

English | Technical

Explorons quelques techniques avancées de visualisation

by necemon 6. November 2010 20:47

 

Cette étude porte sur la production et la description de certains graphiques de visualisation avancées liées à l'enseignement supérieur dans le Sud-Ouest du Pays De Galles. Quelques données réelles ont été utilisées pour compléter cette tâche et l'objectif est d'obtenir un aperçu significatif et intéressant a propos de ​​ces données.

 

Les fichiers de données viennent d'un agent de gestion des informations depuis l'Unité des statistiques en collaboration avec l'Unité de planification stratégique et des Projets (PSPU), les deux à Swansea University.

L'outil utilisé est Many Eyes de IBM. Il s'agit d'un service web qui permet à l'utilisateur de télécharger des ensembles de données et peut les transformer en différentes visualisations. Il y avait beaucoup de choix mais seuls certains types de visualisation avancée (surtout des cartes) avait été recommandés (plutôt que des tableaux de base). En outre, des graphiques qui montrent des montees et descentes au fil du temps ont dû être évitées car les données fournies n'étaient pas dependantes du temps. Alors les cinq types de visualisation démontrés ici sont des histogrammes de bloc, des graphiques à bulles, des cartes, des matrices et des treemaps.

1. Carte du Pays de Galles

Les cartes sont vraiment intuitives quand il s'agit de montrer une comparaison basée sur l'emplacement. Dans Many Eyes, la carte du Pays de Gallesest légèrement inexacte, mais elle nous permet d'obtenir un aperçu intéressant des régions les plus populaires où les gens vont faire des études.

Les cartes suivantes montrent les zones les plus fréquentées pour chaque domaine d'études pour les étudiants de premier cycle à plein temps au pays de Galles. Les données originales divisaient les étudiants en fonction de leurs institutions. Toutefois, pour le contexte de la cartographie, ces institutions ont dû être regroupées selon les villes respectives auxquelles elles appartiennent. Plus une région est sombre, plus elle est fréquentée pour ce domaine d'étude et inversement. Ceci ne s'applique pas à la zone grise, ce qui représente la zone pour laquelle nous ne disposons pas de données.

 

 

Considérons maintenant un cas particulier, le domaine de l'informatique. Nous pouvonsclairement voir que Swansea est l'une des destinations les plus populaires pour étudier les sciences informatiques au Pays de Galles. Toutefois, lorsque l'on considère tous les sujetsensemble, Cardiff semble être le choix le plus populaire en général.

 

 

 

2. Matrices

Les graphiques matrices sont généralement utilisées pour afficher des données multidimensionnelles dans une grille. C'est très utile lorsqu'on a de nombreux critères pour décrire les mêmes données, par exemple, quand on utilise des cartes de matrice pour décrire les étudiants sur la base des matières qu'ils étudient, leurs institutions et s'ils sont deja diplômés ou pas (undergraduate vs postgraduate). Notre grille du bas offre une seule ligne avec 2 disques: UG(undergraduate) et PG(postgraduate) et au sein de chaque disque, on peut voir la proportion de chaque sujet relativement à d'autres. Le premier résultat qui frappe, c'est qu'il ya beaucoup plus d'étudiants de premier cycle que d'étudiants diplômés.

Un autre résultat évident est qu'il ya un large éventail de sujets étudiés dans le pays de Galles.

 


 

Ci-dessous nous voyons que les etudes en psychologie (5,6%) semblent être très populaires parmi les étudiants de Swansea University tandis que l'informatique ne représente que 0,96%.

 

 

 

La matrice ci-dessous représente presque les mêmes données, mais seulement au niveau du sud-ouest du Pays de Galles.

 

 

 

3. arborescences

Le treemapping est une méthode d'affichage arborescent de données en utilisant des rectangles emboîtés. Les treemaps montrent des données hiérarchiques comme un ensemble de rectangles emboîtés. Chaque branche de l'arbre est representé par un rectangle, qui est ensuite carrelée avec de petits rectangles représentant des sous-branches. Pour notre contexte actuel, nous utilisons des treemaps pour comparer visuellement les différences dans le nombre d'étudiants à temps plein parmi les domaines d'études au niveau post-universitaire. On subdivise les étudiants selon leur origine (Royaume-Uni, Union Europeenne, non UE). Le diagramme obtenu nous donne un aperçu intéressant.

Par exemple, nous remarquons que beaucoup de non-Européens viennent au Royaume-Uni pour des études commerciales et administratives. En outre, pour la plupart des sujets, le nombre de non -Européens dépasse le nombre d'étudiants Europeens (hors Royaume-Uni).

 


 

 

Ce que nous avons observé au niveau du Royaume-Uni est assez similaire à ce que nous voyons quand nous considérons le pays de Galles uniquement. Toutefois, les couleurs ont tendance à laisser entendre que le pourcentage d'étudiantsi nternationaux est moins important au pays de Galles.

 

 

4. Graphiques à bulles

Les graphiques à bulles sont une autre forme intuitive et agréable qui nous permet de visualiser "qui étudie quoi". Là encore, nous observons les étudiants de maitrise à plein temps de master.

La figure ci-dessous confirme que la proportion importante d'étudiants non européens dans le Sud-Ouest du Pays de Galles. Et là encore, nous voyons qu'ils sont fortement représentés dans les affaires et les études d'administration et des affaires. D'ailleurs, les études en administration représentent apparemment le domaine d'étude le plus populaire.

 


 

Les deux graphiques suivants exposent le cas de Cardiff et Swansea. La tendance est la même chose, mais on peut remarquer que par rapport à Cardiff, Swansea présente une proportion plus faible d'etudiants en administration des affaires. Cependant, à Swansea, l'informatique et l'engineurie sont bien plus populaires qu'a Cardiff.

 

 

5. Histogrammes de bloc

Un histogramme de bloc vous permet de voir la distribution des valeurs numériques dans un ensemble de données. L'axe des abscisses est divisé en "bacs" qui correspondent à des plages de valeurs. Chaque élément de l'ensemble des données est dessiné comme un bloc rectangulaire, et les blocs sont entassés dans les piles pour montrer combien les valeurs dans chaque gamme.

La figure ci-dessous montre les populations d'étudiants de premier cycle en fonction de leursinstitutions. Il ressort clairement que Swansea University est de loin la destination préférée pour étudier le français avec plus de 120 étudiants. Toutes les autres institutions comptent moins de 10 étudiants pour la langue française.

 


 

On observe alors une comparaison entre UG temps plein et les étudiants à temps partiel UG (encore une fois en fonction de leurs institutions). La première chose qui sort de ces visualisations est qui sont beaucoup plus étudiants à temps plein que les étudiants à temps partiel (ce qui est logique). En outre, tandis que l'Université de Swansea semble être très populaire parmi les étudiants à temps plein, la population des étudiants à temps partiel est à peu près également répartie entre les institutions.

 

Tags: , ,

Francais | Technical

Exploring Some Advanced Visualisation Techniques

by necemon 6. November 2010 10:36

This study is about the production and the description of some advanced visualization charts related to the higher education in South West Wales. Some actual data had been made available to complete this task and the objective is to get some meaningful and interesting insight about the data.

 

 The data files are from a Management Information Officer in the Statistics Unit in conjunction with the Planning and Strategic Projects Unit (PSPU), both at Swansea University.

 

The tool used is IBM Many Eyes. It’s a web service that lets user upload data sets and can turn them into various visualizations. There were a lot of choices but only advanced visualization types (especially maps) had been highly recommended rather than basic charts. Further, graphs that show rises and falls over time had to be avoided as the provided data was not time oriented. So the five visualization types demonstrated here are block histograms, bubble charts, maps, matrix charts and tree maps.

 

1.     Wales Map

Maps are really intuitive when it comes to show a comparison based on the location. In Many Eyes, the Wales map is slightly inaccurate but it allows us to get an interesting overview of the most popular regions where people go to study.

 

The following maps show the most frequented areas for each field of studies for the full time undergraduate students in Wales. The original data was dividing students according to their institutions. However, for the sake of mapping, those institutions had to be aggregated according to the respective cities they belong to. The darker an area is, the more it’s frequented for that field of study and inversely, the lighter a region is, the less it’s frequented. This doesn’t apply to the gray area, which represent the zone for which we don’t have any data.


Now let’s consider a particular case, the field of computer science. We can clearly see that Swansea is one of the most popular destinations to study computer sciences in Wales. However, when we consider all the subjects together, Cardiff appears to be the most popular choice overall.

 

 

 

2.     Matrix Charts

 

Matrix Charts are typically used typically used to display multidimensional data in a grid. It’s very useful when we have many criteria to describe the same data, for example we use matrix charts to describe students based on the subjects they are studying, their institutions and whether they are undergraduates or postgraduates. Our grid down here offers a single row with 2 discs: UG and PG and within each disc, we can see the proportion of each subject relatively to others.  The first result that strikes is that there are much more undergraduate students than postgraduates students.

Another obvious result is that there is a wide range of subjects studied in Wales.

 

Below we see that Nursing (9.89%) and Psychology(5.6%) seem to be quite popular among undergraduates in Swansea university whereas Computer Science only represents 0.96%.


The matrix chart below represent almost the same data but only at the South West Wales level.

 

 

3.     Treemaps

 

Treemapping is a method for displaying tree-structured data by using nested rectangles. Treemaps display hierarchical (tree-structured) data as a set of nested rectangles. Each branch of the tree is given a rectangle, which is then tiled with smaller rectangles representing sub-branches (Wikipedia definition). For our purposes, we use treemaps to visually compare the differences in number of students among areas of studies at the full time postgraduate taught level. We subdivide the students in the fields of studies according to their origin (UK, EU, Non-EU). The diagram obtained gives us some interesting insight.

For example, we notice that a lot of non- Europeans comes to the UK for business and administrative studies. Further, for most of the subjects, the number of non – Europeans exceeds the number of other EU students.

 


What we observed at the UK level is quite similar to what we see when we consider the Wales only. However the colours tend to imply that the percentage of international students is less in Wales.

 

 

4.     Bubble Charts

 

Bubble Charts are another intuitive and atheistically pleasing to visualize “who is studying what”. Here again we are studying the full time master students.

The figure below confirms the wide proportion of Non EU students in South West Wales. And here again we see they are highly represented in Business and Administrative studies. Anyways, Business and Administrative studies apparently represent the most popular field of study.

 

The two following Bubble Charts display the cases of Cardiff and Swansea. The trend is quite the same with the rest of the South West Wales but we can notice that compared to Cardiff, Swansea presents a smaller proportion of Business and Administrative Studies students. However, in Swansea, Engineering and Computer Science are quite more popular than in Cardiff.


 

 

5.     Block Histograms

 

A block histogram lets you see the distribution of numeric values in a data set. The x-axis is divided into "bins" that correspond to value ranges. Each item in the data set is drawn as a rectangular block, and the blocks are piled into the bins to show how many values in each range. (Many Eyes definition)

The figure down here shows the populations of full time undergraduate students based on their institutions. It clearly comes out that Swansea University is by far the favourite destination for studying French with more than 120 students. All the other institutions only have less than 10 students for the French Language.

 

 

 

We then observe a comparison between full time UG and part time UG students (again based on their institutions). The first thing that comes out of those visualizations is that are much more full time students than part time students (which makes sense). Further, while Swansea University seems to be quite popular among full time students, the population of part time students is pretty much equally spread among the institutions.

 

 

 

 

Tags: , ,

English | Technical

About

Necemon

I am Necemon Yai. I am a .NET developer and a digital artist. Let's keep in touch via Twitter, LinkedIn or Facebook.

Je suis Necemon Yai. Je suis un développeur .NET et un artiste numérique. Restons en contact via Twitter, LinkedIn ou Facebook.