Re: st: Première différence dans les données de panel Fri, 18 Nov 2005 09:06:49 0500 xtivreg, fd fait la première différence pour vous. Vous n'avez pas besoin de la première différence de vos variables. Daniel A 12h35 11182005, vous avez écrit: Je voudrais ajouter une question à la question déjà posée. Pour la première commande de différence dans xtivreg y z x (z a b c), fd i (panelid) dois je faire la différence toutes les variables, le comand faire automatiquement cela, ou n'est ce pas la première différence que je pense de Désolé pour toutes ces questions. J'ai juste commandé le manuel xt, mais je ne peux pas attendre jusqu'à ce qu'il arrive ici. Gregor Franz a écrit: Tout d'abord, je remercie les gens qui ont répondu à ma dernière question sur le, bêta. Lorsque vous utilisez les données du panneau avec une première approche de différenciation comme décrit dans Wooldridge (2002), puis je utiliser la commande xt Il ressemble à je ne peux pas à partir des fichiers d'aide. Donc, j'ai juste la différence de toutes mes variables et d'exécuter un deltay normale deltax deltax Merci encore, Pour des questions rapides e mail dataprinceton. edu. Pas d'appts. Nécessaire pendant les heures de marche. Remarque: le laboratoire DSS est ouvert tant que Firestone est ouvert, aucun rendez vous nécessaire pour utiliser les ordinateurs de laboratoire pour votre propre analyse. Introduction aux données du panel Les données du panel, également appelées données longitudinales ou transversales, sont des données où plusieurs cas (personnes, entreprises, pays, etc.) ont été observés à deux ou plusieurs périodes. On peut citer, par exemple, l'Enquête longitudinale nationale sur la jeunesse, où un échantillon représentatif national de jeunes a fait l'objet d'enquêtes répétées sur plusieurs années. Il existe deux types d'information dans les données transversales de séries chronologiques: les informations transversales reflétées dans les différences entre les sujets et les séries temporelles ou l'information intra sujet reflétée dans les changements dans les sujets au fil du temps. Les techniques de régression de données de panel vous permettent de profiter de ces différents types d'informations. Bien qu'il soit possible d'utiliser des techniques ordinaires de régression multiple sur des données de panel, elles peuvent ne pas être optimales. Les estimations des coefficients dérivés de la régression peuvent être sujettes à un biais de variable omis un problème qui se pose lorsqu'il existe une ou plusieurs variable (s) inconnue (s) qui ne peut pas être contrôlée et qui affecte la variable dépendante. Avec des données de panel, il est possible de contrôler pour certains types de variables omises même sans les observer, en observant les changements dans la variable dépendante dans le temps. Cela contrôle les variables omises qui diffèrent entre les cas mais qui sont constantes dans le temps. Il est également possible d'utiliser des données de panel pour contrôler les variables omises qui varient dans le temps mais qui sont constantes entre les cas. Utilisation des données de panel dans Stata Un ensemble de données de panel doit avoir des données sur n cas, sur t périodes de temps, pour un total de n fois t observations. Des données comme celle ci sont dites être en forme longue. Dans certains cas, vos données peuvent venir dans ce qu'on appelle la forme large, avec une seule observation par cas et des variables pour chaque valeur différente à chaque période de temps différente. Pour analyser des données comme celle ci dans Stata à l'aide de commandes pour l'analyse des données du panneau, vous devez d'abord le convertir en formulaire long. Cela peut être fait en utilisant la commande Statas reshape. Pour obtenir de l'aide sur l'utilisation de remodeler, consultez l'aide en ligne de Statas ou cette page Web. Stata fournit un certain nombre d'outils pour analyser les données du panel. Les commandes commencent toutes par le préfixe xt et incluent les versions de données xtreg, xtprobit, xtsum et xttab panel des commandes reg, probit, sum et tab. Pour utiliser ces commandes, dites d'abord à Stata que votre jeu de données est des données de panneau. Vous devez disposer d'une variable qui identifie l'élément de cas de votre panneau (par exemple, un identifiant de pays ou de personne) et également une variable de temps qui est au format de date Stata. Pour plus d'informations sur les formats de variable de date Statas, consultez notre page Données temporelles dans Stata. Trier vos données par la variable de panneau puis par la variable de date dans la variable de panneau. Ensuite, vous devez émettre la commande tsset pour identifier les variables de tableau et de date. Si votre variable de panneau est appelée panelvar et que votre variable de date est appelée datevar, les commandes nécessaires sont: Si vous préférez utiliser des menus, utilisez la commande sous Statistiques Time Series Setup et Utilities Declare Data pour être Time Series. Modèles d'effets fixes, intermédiaires et aléatoires Régression des effets fixes La régression des effets fixes est le modèle à utiliser lorsque vous souhaitez contrôler les variables omises qui diffèrent entre les cas mais qui sont constantes dans le temps. Il vous permet d'utiliser les changements dans les variables au cours du temps pour estimer les effets des variables indépendantes sur votre variable dépendante et est la principale technique utilisée pour l'analyse des données du panel. La commande pour une régression linéaire sur des données de panel avec des effets fixes dans Stata est xtreg avec l'option fe, utilisée comme ceci: Si vous préférez utiliser les menus, la commande est sous Statistiques Séries chronologiques linéaires Régression linéaire. Cela équivaut à générer des variables fictives pour chacun de vos cas et à les inclure dans une régression linéaire standard pour contrôler ces effets de cas fixes. Il fonctionne mieux lorsque vous avez relativement peu de cas et plus de périodes de temps, comme chaque variable fictive supprime un degré de liberté de votre modèle. Entre effets La régression entre les effets est le modèle à utiliser lorsque vous souhaitez contrôler les variables omises qui changent dans le temps mais qui sont constantes entre les cas. Il vous permet d'utiliser la variation entre les cas pour estimer l'effet des variables indépendantes omises sur votre variable dépendante. La commande pour une régression linéaire sur les données du panneau entre les effets dans Stata est xtreg avec l'option be. Exécuter xtreg avec entre effets équivaut à prendre la moyenne de chaque variable pour chaque cas à travers le temps et à exécuter une régression sur le jeu de données réduit des moyens. Comme il en résulte une perte d'information, entre les effets ne sont pas utilisés beaucoup dans la pratique. Les chercheurs qui veulent regarder les effets de temps sans considérer les effets de panneau utilisent généralement un ensemble de variables fictives de temps, qui est le même que les effets fixes de temps de course. L'estimateur entre les effets est principalement important parce qu'il est utilisé pour produire l'estimateur des effets aléatoires. Effets aléatoires Si vous avez des raisons de croire que certaines variables omises peuvent être constantes au fil du temps, mais varier d'un cas à l'autre et que d'autres peuvent être fixées entre les cas, mais varier dans le temps, vous pouvez inclure les deux types en utilisant des effets aléatoires. L'estimateur des effets aléatoires de Statas est une moyenne pondérée des effets fixes et intermédiaires. La commande pour une régression linéaire sur des données de panel avec des effets aléatoires dans Stata est xtreg avec l'option re. Choisir entre les effets fixes et aléatoires La manière généralement acceptée de choisir entre les effets fixes et aléatoires est d'exécuter un test de Hausman. Statistiquement, les effets fixes sont toujours une chose raisonnable à faire avec les données du panel (ils donnent toujours des résultats cohérents), mais ils peuvent ne pas être le modèle le plus efficace à exécuter. Les effets aléatoires vous donnent de meilleures valeurs P, car ils sont un estimateur plus efficace, donc vous devriez exécuter des effets aléatoires s'il est statistcally justifiable de le faire. Le test de Hausman vérifie un modèle plus efficace par rapport à un modèle moins efficace mais cohérent pour s'assurer que le modèle plus efficace donne également des résultats cohérents. Pour exécuter un test de Hausman comparant des effets fixes avec des effets aléatoires dans Stata, vous devez d'abord estimer le modèle d'effets fixes, enregistrer les coefficients de sorte que vous puissiez les comparer avec les résultats du modèle suivant, estimer le modèle d'effets aléatoires, Comparaison. Le test hausman teste l'hypothèse nulle selon laquelle les coefficients estimés par l'estimateur efficace des effets aléatoires sont les mêmes que ceux estimés par l'estimateur des effets fixes cohérents. Si elles sont (valeur P insignifiante, Probchi2 supérieure à 0,05), il est sûr d'utiliser des effets aléatoires. Si vous obtenez une valeur de P significative, cependant, vous devez utiliser des effets fixes. Lectures complémentaires Entre estimateurs de Stata Une discussion comparant l'estimateur entre l'estimateur d'effets aléatoires. Test d'hétéroscédasticité et d'autocorrélation au niveau du panneau à partir de Stata Comprend une commande écrite par l'utilisateur qui effectue un test simple de corrélation sérielle. Introduction à l'économétrie par James H. Stock et Mark W. Watson, 2003 Ce texte a une bonne discussion de la théorie derrière l'analyse des données du panel, et a été utilisé dans la préparation de cette page. Voir en particulier le chapitre 8, Régression avec données de panel. Copie 2007 Les fiduciaires de l'Université de Princeton. Tous les droits sont réservés. Dataprinceton. edu NOTE: L'information est pour l'université de Princeton. N'hésitez pas à utiliser la documentation, mais nous ne pouvons pas répondre à des questions en dehors de Princeton Dernière page Dernière mise à jour: Re: st: Première différence dans les données de panel Fri, 18 Nov 2005 09:06:49 0500 xtivreg, fd fait la première différence pour toi. Vous n'avez pas besoin de la première différence de vos variables. Daniel A 12h35 11182005, vous avez écrit: Je voudrais ajouter une question à la question déjà posée. Pour la première commande de différence dans xtivreg y z x (z a b c), fd i (panelid) dois je faire la différence toutes les variables, le comand faire automatiquement cela, ou n'est ce pas la première différence que je pense de Désolé pour toutes ces questions. J'ai juste commandé le manuel xt, mais je ne peux pas attendre jusqu'à ce qu'il arrive ici. Gregor Franz a écrit: Tout d'abord, je remercie les gens qui ont répondu à ma dernière question sur le, bêta. Lorsque vous utilisez les données du panneau avec une première approche de différenciation comme décrit dans Wooldridge (2002), puis je utiliser la commande xt Il ressemble à je ne peux pas à partir des fichiers d'aide. Donc, j'ai juste la différence de toutes mes variables et d'exécuter une normale deltay deltax deltax Merci encore, Pour des questions rapides email dataprinceton. edu. Pas d'appts. Nécessaire pendant les heures de marche. Note: le laboratoire DSS est ouvert tant que Firestone est ouvert, aucun rendez vous nécessaire pour utiliser les ordinateurs de laboratoire pour votre propre analyse. Introduction aux données du panel Les données du panel, également appelées données longitudinales ou transversales, sont des données où plusieurs cas (personnes, entreprises, pays, etc.) ont été observés à deux ou plusieurs périodes. On peut citer, par exemple, l'Enquête longitudinale nationale sur la jeunesse, où un échantillon représentatif national de jeunes a fait l'objet d'enquêtes répétées sur plusieurs années. Il existe deux types d'information dans les données transversales de séries chronologiques: les informations transversales reflétées dans les différences entre les sujets et les séries temporelles ou l'information intra sujet reflétée dans les changements au sein des sujets au fil du temps. Les techniques de régression de données de panel vous permettent de profiter de ces différents types d'informations. Bien qu'il soit possible d'utiliser des techniques ordinaires de régression multiple sur des données de panel, elles peuvent ne pas être optimales. Les estimations des coefficients dérivés de la régression peuvent être sujettes à un biais de variable omis un problème qui se pose lorsqu'il existe une ou plusieurs variable (s) inconnue (s) qui ne peut pas être contrôlée et qui affecte la variable dépendante. Avec les données de panel, il est possible de contrôler pour certains types de variables omises même sans les observer, en observant les changements dans la variable dépendante dans le temps. Cela contrôle les variables omises qui diffèrent entre les cas mais qui sont constantes dans le temps. Il est également possible d'utiliser des données de panel pour contrôler les variables omises qui varient dans le temps mais qui sont constantes entre les cas. Utilisation des données de panel dans Stata Un ensemble de données de panel doit avoir des données sur n cas, sur t périodes de temps, pour un total de n fois t observations. Des données comme celle ci sont dites être en forme longue. Dans certains cas, vos données peuvent venir dans ce qu'on appelle la forme large, avec une seule observation par cas et des variables pour chaque valeur différente à chaque période de temps différente. Pour analyser des données comme celle ci dans Stata à l'aide de commandes pour l'analyse des données du panneau, vous devez d'abord le convertir en formulaire long. Cela peut être fait en utilisant la commande Statas reshape. Pour obtenir de l'aide sur l'utilisation de remodeler, consultez l'aide en ligne de Statas ou cette page Web. Stata fournit un certain nombre d'outils pour analyser les données du panel. Les commandes commencent toutes par le préfixe xt et incluent les versions de données xtreg, xtprobit, xtsum et xttab panel des commandes reg, probit, sum et tab. Pour utiliser ces commandes, dites d'abord à Stata que votre dataset est des données de panneau. Vous devez disposer d'une variable qui identifie l'élément de cas de votre panneau (par exemple, un identifiant de pays ou de personne) et également une variable de temps qui est au format de date Stata. Pour plus d'informations sur les formats de variable de date Statas, consultez notre page Données temporelles dans Stata. Trier vos données par la variable de panneau puis par la variable de date dans la variable de panneau. Ensuite, vous devez émettre la commande tsset pour identifier les variables de tableau et de date. Si votre variable de panneau est appelée panelvar et que votre variable de date est appelée datevar, les commandes nécessaires sont: Si vous préférez utiliser des menus, utilisez la commande sous Statistiques Time Series Setup et Utilities Declare Data pour être Time Series. Modèles d'effets fixes, intermédiaires et aléatoires Régression des effets fixes La régression des effets fixes est le modèle à utiliser lorsque vous souhaitez contrôler les variables omises qui diffèrent entre les cas mais qui sont constantes dans le temps. Il vous permet d'utiliser les changements dans les variables au cours du temps pour estimer les effets des variables indépendantes sur votre variable dépendante et est la principale technique utilisée pour l'analyse des données du panel. La commande pour une régression linéaire sur des données de panel avec des effets fixes dans Stata est xtreg avec l'option fe, utilisée comme ceci: Si vous préférez utiliser les menus, la commande est sous Statistiques Séries chronologiques linéaires Régression linéaire. Cela équivaut à générer des variables fictives pour chacun de vos cas et à les inclure dans une régression linéaire standard pour contrôler ces effets de cas fixes. Il fonctionne mieux lorsque vous avez relativement peu de cas et plus de périodes de temps, comme chaque variable fictive supprime un degré de liberté de votre modèle. Entre effets La régression entre les effets est le modèle à utiliser lorsque vous souhaitez contrôler les variables omises qui changent dans le temps mais qui sont constantes entre les cas. Il vous permet d'utiliser la variation entre les cas pour estimer l'effet des variables indépendantes omises sur votre variable dépendante. La commande pour une régression linéaire sur les données du panneau entre les effets dans Stata est xtreg avec l'option be. Exécuter xtreg avec entre les effets équivaut à prendre la moyenne de chaque variable pour chaque cas à travers le temps et à exécuter une régression sur le jeu de données réduit des moyens. Comme il en résulte une perte d'information, entre les effets ne sont pas utilisés beaucoup dans la pratique. Les chercheurs qui veulent regarder les effets de temps sans considérer les effets de panneau utilisent généralement un ensemble de variables fictives de temps, qui est le même que les effets fixes de temps de course. L'estimateur entre les effets est principalement important parce qu'il est utilisé pour produire l'estimateur des effets aléatoires. Effets aléatoires Si vous avez des raisons de croire que certaines variables omises peuvent être constantes dans le temps, mais varier d'un cas à l'autre et que d'autres peuvent être fixées entre les cas, mais varier dans le temps, vous pouvez inclure les deux types en utilisant des effets aléatoires. L'estimateur des effets aléatoires de Statas est une moyenne pondérée des effets fixes et intermédiaires. La commande pour une régression linéaire sur des données de panel avec des effets aléatoires dans Stata est xtreg avec l'option re. Choisir entre les effets fixes et aléatoires La manière généralement acceptée de choisir entre les effets fixes et aléatoires est d'exécuter un test de Hausman. Statistiquement, les effets fixes sont toujours une chose raisonnable à faire avec les données du panel (ils donnent toujours des résultats cohérents), mais ils peuvent ne pas être le modèle le plus efficace à exécuter. Les effets aléatoires vous donnent de meilleures valeurs P, car ils sont un estimateur plus efficace, donc vous devriez exécuter des effets aléatoires s'il est statistcally justifiable de le faire. Le test de Hausman vérifie un modèle plus efficace par rapport à un modèle moins efficace mais cohérent pour s'assurer que le modèle plus efficace donne également des résultats cohérents. Pour exécuter un test de Hausman comparant des effets fixes avec des effets aléatoires dans Stata, vous devez d'abord estimer le modèle d'effets fixes, enregistrer les coefficients de sorte que vous puissiez les comparer avec les résultats du modèle suivant, estimer le modèle d'effets aléatoires, Comparaison. Le test hausman teste l'hypothèse nulle selon laquelle les coefficients estimés par l'estimateur efficace des effets aléatoires sont les mêmes que ceux estimés par l'estimateur des effets fixes cohérents. Si elles sont (valeur P insignifiante, Probchi2 supérieure à 0,05), il est sûr d'utiliser des effets aléatoires. Si vous obtenez une valeur de P significative, cependant, vous devez utiliser des effets fixes. Lectures complémentaires Entre estimateurs de Stata Une discussion comparant l'estimateur entre l'estimateur d'effets aléatoires. Test de l'hétéroscédasticité et de l'autocorrélation au niveau du panneau à partir de Stata Comprend une commande écrite par l'utilisateur qui effectue un simple test de corrélation sérielle. Introduction à l'économétrie par James H. Stock et Mark W. Watson, 2003 Ce texte a une bonne discussion de la théorie derrière l'analyse des données du panel, et a été utilisé dans la préparation de cette page. Voir en particulier le chapitre 8, Régression avec données de panel. Copie 2007 Les fiduciaires de l'Université de Princeton. Tous les droits sont réservés. Dataprinceton. edu NOTE: L'information est pour l'université de Princeton. N'hésitez pas à utiliser la documentation, mais nous ne pouvons pas répondre aux questions en dehors de Princeton Dernière mise à jour de cette page:
No comments:
Post a Comment