vc poderia ter mostrado o dataframe primeiro...grato
@lucasduarte15644 жыл бұрын
tá voando no python moneti
@DisciplinaemFoco3 жыл бұрын
Ao importar a pmdarima.arima, já aconteceu esse erro? ImportError: cannot import name 'ParseError' from 'statsmodels.tools.sm_exceptions' (/usr/local/lib/python3.7/dist-packages/statsmodels/tools/sm_exceptions.py) Grato desde já!
@erivan24002 жыл бұрын
Escolher o melhor modelo SARIMA antes de separar em treino e teste é um erro conceitual. Ocorreu um data leakage.
@escoladeinteligenciaartifi65972 жыл бұрын
10:28
@erivan24002 жыл бұрын
@@escoladeinteligenciaartifi6597 Na minha percepção quando você define os melhores parâmetros no stepwise_model usando os dados inteiros ocorre um enviesamento do que acontece no futuro. Mesmo dando o fit no treino depois, não era pra se conhecer a parcela total dos dados quando define os parâmetros p d q P D Q
@escoladeinteligenciaartifi65972 жыл бұрын
@@erivan2400 De quem forma você iria dividir os dados para buscar os melhores parametros? Simplismente cortando a série ao meio? E se componentes importantes para a minimização do AIC forem perdidos? Entendo que devemos buscar os melhores parametros com toda a série, e então treinar e testar o modelo com subconjuntos.
@erivan24002 жыл бұрын
@@escoladeinteligenciaartifi6597 Entendo, mas acredito ser um mal necessário. Acho que a busca dos parâmetros devem ser buscados no train set. Afinal esse train era pra ser tudo que conhecemos pra fazer previsão. E sobre os componentes, muito provavelmente vamos perder, mas faz parte do processo por não conhecermos os dados de teste (futuro) ainda. Ao meu ver está introduzindo um vies fazendo um AIC com a série inteira. Na prática, quando formos de fato prever dados desconhecidos, não conhecemos a série inteira.
@johnylira2 жыл бұрын
@@erivan2400 Concordo com você, faz mais sentido o modelo ser treinado da maneira que será utilizado. Calibramos no passado, testamos no presente, para haver evidência de ser um bom modelo para o futuro (onde não há dados)