とても面白かったです。コードも見ました。 せっかくなので少し質問です。 1. "test rel to prev"のp値が"test rel to original"のp値よりも小さめになっているのですが、どんどん条件付き独立なペアを仮定していくにつれoriginalに対しての条件が増えていきoriginalから離れていくので、test rel to originalのp値がどんどん小さくなるのでは、逆にprevとの比較では一つのペアの違いしかないのでp値はそれほど小さくならないのでは、と思ったのですが、どうしてこのようなことが起こっているのでしょう。 2. 同じくp値0.28で、条件付き独立を仮定しなかった場面で、「0 が他のすべての変数と独立になるので、良くないらしい。」とありましたが、データの構造的にそのような可能性もあるとは思うのですが、このあたりはあくまでも「よりもっともらしい」変数の関係性を求めるという意味で分析者の手に委ねられる、ということなんでしょうか。(これが正しい、という答えはデータだけからは得られない?)
@AIcia_Solid4 жыл бұрын
質問ありがとうございます! コードも解読いただき嬉しいです😍 1 について 検定に用いる「逸脱度」は、おっしゃる通り仮定を増やせば増やすほど増えます。 これは適当な自由度の t 分布に従うので、 t 検定するのですが、自由度がモデルによって異なるため、 p 値は割と自由な大小の値をとることができます。 2 については、まさにおっしゃる通りです。
ご視聴コメントありがとうございます!😍 トライ&エラーをばばばばばーっ!と繰り返した結果なので、あまり詳しく覚えていません、、すみません。 データの背景の知識を発見することが目的でしたので、色んな分析を繰り返し、直感と照らして違和感がない結果を与える変数群を利用しました。 実際には、相関行列をとったり、回帰分析してみたり、グラフィカルモデリングの分析をしてみたりです。 プレミア公開については、後半ほとんどプレミア公開にしていますので、プレミア公開 or not を表す変数というより、ある地点より前か後かを表す変数に近かったので、意味なかろうと利用をやめました。 公開からの経過日数は、それが再生数に影響を与えているだろうと加えたのですが、時系列データではない断面のデータでは、日数以外の要素の方が強く出てしまい、あまり役に立たなかったので捨てました😋