Please enable JavaScript.
Coggle requires JavaScript to display documents.
travail de modélisation des non-voyageurs, Piste 1: gares villes VS gares…
travail de modélisation des non-voyageurs
modélisation du nombre de non-voyageurs
Modélisation de la part de non-voyageurs
Rien n'a été fait pour l'instant
Piste 1
: gares villes VS gares périphériques
Faire deux groupes de gares les gares ville et les gares périphériques par rapport à la distance au centre-ville
Ce qui a été fait
:
calcul des distances gares - centre ville de la commune associée avec Qgis
Ce qu'il reste à faire/à améliorer
:
les distances sont parfois aberrantes à cause de code INSEE associés aux mauvaises communes + erreurs de calculs.
autre limite: certaines gares périphériques comme Meuse TGV sont situés dans des toutes petites communes donc la distance au centre-ville a bien été calculée, elle est faible alors que c'est une gare périphérique. Ce qui remet en cause l'idée de se baser sur un critère de distance pour dire s'il s'agit d'une gare ville ou d'une gare périphérique.
Clustering sur l'ensemble des 174 gares selon deux variables: nb individus et nb logements
ce qui a été fait
:
clustering k-means en 2 classes
modèle gares Transilien (10 gares)
modèle gares non Transilien (151 gares)
modèle 13 grandes gares
Ouvre la voie vers une nouvelle piste
: séparer les accompagnants des autres non-voyageurs
Ce qui a été fait
:
récupérer la part d'accompagnants pour les gares où elle est disponible dans les enquêtes d'accessibilité (47 gares)
tirage aléatoire de la part d'accompagnants avec une loi uniforme sur [0,2;0,9]
modèle sur le nombre d'accompagnants sur l'ensemble des 174 gares
modèle sur les non-voyageurs non-accompagnants sur les 174 gares
Ce qui reste à améliorer
:
chercher d'autres méthodes de tirage aléatoire que la loi uniforme
ajuster les paramètres de la loi uniforme en fonction de si une gare est une gare ville ou une gare périphérique
Faire des modèles avec accompagnants et autres non-voyageurs séparés mais sur des groupes de gares (ville/périphérique ou autre)
Piste 2
: un modèle sur les gares de type A et un modèle sur les gares de type B
limites
:
Le modèle pour les gares B explique mal la variance (R^2=0,21)
problème d'homoscédasticité pour les deux modèles
il est étrange que les variables explicatives soient des variables associées à des offres ferroviaires pour des non-voyageurs
Cette piste de réflexion est à fermer
: il faut rentrer dans un niveau de détail plus précis que cette classification
Piste 3
: faire un modèle sur les gares de la classification marketing DCMT
rien a été fait pour l'instant
ce qui a été fait
:
un modèle de régression sur le nombre de non-voyageurs dans les gares A et un dans les gares B