😮 Cómo Usar ChatGPT Sobre Información Interna De Tu Negocio

  Рет қаралды 70,590

DataScience ForBusiness

DataScience ForBusiness

Жыл бұрын

👉 Notebook con el código: datascience4business.com/f/lm...
Esta aplicación de ChatGPT lo cambia todo. Hasta ahora ChatGPT nos ayudaba sobre todo como profesionales, escribiendo texto o código.
Pero estábamos limitados a la información con la que ChatGPT había sido entrenado.
Con lo que te explico en este vídeo ya puedes usar toda la capacidad de ChatGPT para analizar la información interna de la empresa (ten cuidado con las cuestiones de privacidad).
#chatgpt #openaiapi

Пікірлер: 139
@yuniorbatista2416
@yuniorbatista2416 Жыл бұрын
Seria interesante una segunda parte con la implementación de este codigo como un servicio de chatbot en una página web
@RicharGonzalez
@RicharGonzalez Жыл бұрын
Que impresionante poder usar esta herramienta como la muestras, me encanto tu video y muy bien explicado, realmente quedo muy agradecido por entregar esta información y que podamos prender a este nivel. Muchas gracias.
@watsaysurfschool-cantabria
@watsaysurfschool-cantabria Жыл бұрын
Llevaba mucho tiempo buscando esto, gracias por el aporte.
@churtado1984
@churtado1984 Жыл бұрын
sos de otro mundo, gracias por cmpartir ... empezare mi semana
@platerplane
@platerplane Жыл бұрын
enorme video, con su explicación teórica previa bastante clara. Muchas gracias!!
8 ай бұрын
Magnífica aportación y de gran valor!! Mil gracias Isaac!!
@enriquemartinez3380
@enriquemartinez3380 Жыл бұрын
Como siempre muy interesante tus videos Isaac. Aunque parece que ChatGPT cada vez irá ampliando más las ventanas de contexto y que con los pluguins que se está desarrollando y que vendrán cada vez más funcionará como un asistente que hará cualquier tarea que necesitemos, sin duda la necesidad de saber cómo preguntarle y el tener los skills para entender y desarrollar la interacción con él, seguirá siendo algo fundamental. Ejemplo es el concepto de "Prompt Engenieer" como nueva profesión.
@fdsgdsffgsfg
@fdsgdsffgsfg Жыл бұрын
Te felicito, muy instructivo y bien explicado.
@edwarddrago9686
@edwarddrago9686 20 күн бұрын
Master, gracias por compartir, excelente trabajo
@javi_v7.0
@javi_v7.0 Жыл бұрын
Gran video, ¡muchas gracias Isaac!
@MartinEnriqueBertello
@MartinEnriqueBertello 5 ай бұрын
Excelente aporte, y muy bien explicado!
@joser100
@joser100 Жыл бұрын
Gracias por el video... vale como introduccion pero me temo que podria llevar a conclusiones erroneas a gente que quiera usar este metodo para procesar datos de su empresa, ya que esta muy simplificado y con ello pierde aspectos importantes. El hecho es que LlamaIndex no puede por si mismo crear esos embeddings/vectores y necesita usar el LLM (algun codex de OpenAI como ADA-003 u otro mas avanzado, ya sea de OpenAI u otro LLM) para generar esos embeddings, es decir, hay dos fases con acceso al LLM, en una primera fase tus datos tienen que ser pre-formateados, en tu ejemplo usas un PDF, pero podrias tener video, bases de datos, u otra informacion que este en formatos privados (datos en Jira, CRMs como Salesforce o muchos otros soportes que pueden usarse en el ambito de empresa), hay un trabajo de adaptacion que no lo va a hacer LlamaIndex (ni siquiera con la version 0.6.0 que lanzaron esta madrugada). LangChain (que tambien es Open Source) tiene mejor cobertura para este pre-procesamiento del corpus de datos, el punto fuerte de LlamaIndex esta mas en la indexacion de los embeddings para realizar, posteriormente, la busqueda semantica cuando lances una pregunta. No voy a alargarme mas ya que lo que queria realmente mencionar es el hecho de que todos los datos que quieras procesar tienen que pasar por OpenAI API en esa fase inicial de creacion de embeddings (a no ser que uses un LLM distinto que sea Open Source y que puedas controlar para que tus datos privados no salgan fuera de tu empresa). He visto que en el ejemplo has usado un documento publico, pero cuando se trata de informacion de caracter sensible de una empresa (en cualquier soporte) hoy dia yo no la pasaria por los APIs de OpenAI, he visto que mencionas los temas de privacidad, perfecto, pero queria poner este aviso adicional para navegantes... (hace un par de dias OpenAI abrio la puerta a quitar el uso de la memoria de ChatGPT, esto lo hizo para responder a la presion de la EU, empezando por Italia, sobre esos temas de prevacidad, sobre todo el hecho de que TODO lo que se manda a traves del API puede ser usado por OpenAI para entrenar nuevas versiones, con lo que es posible que si se envian datos de caracter privado, estos puedan aparecer en publico en el futuro, bueno, en el nivel y grado en que los entrenamientos y fine-tunings llegasen a usar esos datos, pero en cualquier caso OpenAI considera que toda esa informacion que se esta pasando por ChatGPT y los APIs les pertenece como parte del dataset para entrenamientos futuros y esto es importante saberlo, el problema es que al quitar la "memoria" se pierde gran parte del valor que nos da ChatGPT...) En cualquier caso, si este mensaje sirve para alertar sobre el problema de la privacidad de los datos que se comparten con OpenAI, mision cumplida...
@CeroCool212004
@CeroCool212004 Жыл бұрын
Excelente apotación, caballero. 👏
@airebreton
@airebreton Жыл бұрын
gracias @joser100 por puntualizar. justamente todo el interés está en usar un LLM distinto a openAI para poder retener los datos. por ejemplo quiero poder ofrecer una consulta en base a datos elegidos por mi, aunque algunos sean públicos, otros son privados, en cualquier caso quiero retener mi trabajo de recopilación para poder monetizar mi servicio y que éste no se regale. lo de que "abran la puerta a quitar la memoria" en openAI no da aún la confianza necesaria para lanzarse a usarlo. alguna sugerencia de qué LLM de código abierto se puede usar para el caso de la consultoría sobre una selección de documentos? en cualquier caso gracias por precisar, porque ya voy más encaminado.vaya bien.
@NWqwerty
@NWqwerty Жыл бұрын
@@airebreton vicuna, aunque tendria que probar porque no es igual de potente a chatgpt
@Nacho369
@Nacho369 Жыл бұрын
Hola Jose, podría escribirle de forma privada por la cuestión que comenta? gracias de antemano
@joser100
@joser100 Жыл бұрын
@@Nacho369 claro
@ThePablete15
@ThePablete15 6 ай бұрын
Muy interesante, muchas gracias por el video
@aspirezr
@aspirezr Жыл бұрын
Muy bueno, muchas gracias.
@albertdones7727
@albertdones7727 Жыл бұрын
Muuuy bueno !! Muchas gracias !!
@MartinGersbach
@MartinGersbach Жыл бұрын
Excelente capítulo ! ❤
@icerimuru
@icerimuru Жыл бұрын
Nuevo sub c: Gracias por el contenido python es amor ❤
@juanmaromero1590
@juanmaromero1590 Жыл бұрын
Cuando le haces la ultima pregunta.... que resuma los principales riesgos. Primero habria que ver que el resumen de cada riesgo este bien hecho, pero supongamos que lo hizo correctamente. El problema es ...como definió que esos 3 riesgos son los mas importantes y no otros que esten en el documento. Tendria que usar unas operaciones logicas que el modelo todavia no posee... Se podria pedir que nos liste y resuma los riesgos y nosotros decidir cuales son los mas importantes
@mite45
@mite45 Жыл бұрын
Excelente video y aportes Isaac, ya estoy probando para implementaciones con Gradio y/o Flask para mejora de interface. Entiendo que podrían seguir incorporando aplicaciones con Llama y otras librerías para potenciar la App. Gracias Mil.
@asieriturriotz271
@asieriturriotz271 Жыл бұрын
Muy interesante!
@gogomac
@gogomac Жыл бұрын
Gracias!!
@rafadipre
@rafadipre 8 ай бұрын
Buenisimo este video
@josevicente632
@josevicente632 Жыл бұрын
Excelente video
@salitoprincesa
@salitoprincesa Жыл бұрын
No sabía de chatpdf gracias
@andressterenberg6657
@andressterenberg6657 Жыл бұрын
muy Buenoooooo!!!
@brunomarti3308
@brunomarti3308 Жыл бұрын
Impresionante como siempre.
@DataScienceForBusiness
@DataScienceForBusiness Жыл бұрын
gracias!
@noeliaferrero1158
@noeliaferrero1158 Жыл бұрын
Excelente contenido como siempre, muchas grac x compartir! consulta, puede ser que se cambio/actualizo algo en el código? porque hace días que lo intento y no me esta funcionando...
@cinforray
@cinforray Жыл бұрын
Excelente
@JackDaniels-xq2hu
@JackDaniels-xq2hu Жыл бұрын
De locos esto es de vertigo cada vez tienes que aprender más y más para sacar alguna ventaja
@DataScienceForBusiness
@DataScienceForBusiness Жыл бұрын
sí, por un lado eso es bueno si te gusta aprender cosas nuevas, por otro te puede llegar a sobrepasar si intentas llegar a todo en lugar de especializarte
@usuarioift9067
@usuarioift9067 6 ай бұрын
Tuve que hacerle varios cambios al codigo en diciembre del 2023 porque ya no funciona. Aqui les dejo algunos cambios: from llama_index import GPTVectorStoreIndex, SimpleDirectoryReader, LLMPredictor, ServiceContext index = GPTVectorStoreIndex.from_documents(pdf, service_context = service_context) Y en el while poner respuesta = query_engine.query(pregunta) print(respuesta)
@brendamg7298
@brendamg7298 Жыл бұрын
Buen video
@victorhuelvap
@victorhuelvap Жыл бұрын
Una pregunta! ¿Sería capaz de interpretar la información que le proporcionas, o solo actúa de "buscador" como en chatpdf? Gracias
@VictorFernandez-wf5lj
@VictorFernandez-wf5lj Жыл бұрын
me temo que da error al ejecutarlo (cannot import name 'GPTSimpleVectorIndex' from 'llama_index'), ha cambiado algo? por ejemplo: "GPTSimpleVectorIndex was renamed to GPTVectorStoreIndex, try removing it from the end of your imports"
@Nacho369
@Nacho369 Жыл бұрын
Muchas gracias por el aporte. Me descargué el archivo y en el paso "Indexar el contenido de los PDFs" me da error y no consigo solucionarlo. Gracias
@user-gy3tv8do6u
@user-gy3tv8do6u Жыл бұрын
muy interesante! aunque no creo que las empresas vayan a subir sus cuentas/resúmenes al chatgpt para que tenga información privada suya...
@edwardjavier4925
@edwardjavier4925 Жыл бұрын
Muy poderoso código, he aprendido un montón. Me volaste la cabeza. Te cuento que el primer error que me salio fue al ejecutar el código de SimpleDirectoryReader para leer el pdf, y le puse el siguiente codigo: !pip install PyPDF y se arregloooo. Ahora tengo el siguiente error al hacer mi pregunta AttributeError Traceback (most recent call last) in () 2 pregunta = input('Escribe tu pregunta ') + "Responde en español" 3 respuesta = index.as_query_engine().query(pregunta) ----> 4 for frase in textwrap.wrap(respuesta.response, width=100): 5 print(frase) /usr/lib/python3.10/textwrap.py in _munge_whitespace(self, text) 152 """ 153 if self.expand_tabs: --> 154 text = text.expandtabs(self.tabsize) 155 if self.replace_whitespace: 156 text = text.translate(self.unicode_whitespace_trans) AttributeError: 'NoneType' object has no attribute 'expandtabs' Ojala puedas ayudarme con este error por favor. Saludos y muchas gracias por tu tiempo.
@DataScienceForBusiness
@DataScienceForBusiness Жыл бұрын
lamentablemente en este área las cosas están poco estandarizadas y hay mucho trabajo de "fontanería". lo mejor en esos errores es googlear, la casuística es casi infinita
@RicharGonzalez
@RicharGonzalez Жыл бұрын
Hola, muchas gracias por el aporte, pero te quiero contar que baje el desarrollo pero no funciono, se queda topado en la lectura de los pdf. ¿que puedo hacer? nota. no se nada de la programación a este nivel. muchas gracias
@raulalcauza7025
@raulalcauza7025 4 ай бұрын
Hola.Buen video! Aunque estoy intentando replicarlo en mi VSC, pero no es posible, me sale el siguiente error: from llama_index import GPTVectorStoreIndex, SimpleDirectoryReader, LLMPredictor, ServiceContext ImportError: cannot import name 'GPTVectorStoreIndex' from 'llama_index' (unknown location). He visto que ha surgido con anterioridad, pero es que al usar Google Colab también me ocurre el mismo error. En la documentación no hace referencia a esto, ha cambiado en algo la estructura. Por si alguien puede guiarme un poco. Gracias!
@jorgeantoniocabreragonzale3366
@jorgeantoniocabreragonzale3366 Жыл бұрын
Antes que nada muchas gracias por material compartido. Muy interesante y magistralmente expuesto. Quisiera compartir que intentado reproducir el ejercicio, pero tropiezo con el problema de que el componente GPTSimpleVectorIndex no me reconoce su importación llama-index. Datos instalacion: Python 3.11.3 aiohttp==3.8.4 aiosignal==1.3.1 async-timeout==4.0.2 attrs==23.1.0 certifi==2023.5.7 charset-normalizer==3.1.0 colorama==0.4.6 dataclasses-json==0.5.7 frozenlist==1.3.3 greenlet==2.0.2 idna==3.4 langchain==0.0.169 llama-index==0.6.7 marshmallow==3.19.0 marshmallow-enum==1.5.1 multidict==6.0.4 mypy-extensions==1.0.0 numexpr==2.8.4 numpy==1.24.3 openai==0.27.6 openapi-schema-pydantic==1.2.4 packaging==23.1 pandas==2.0.1 pydantic==1.10.7 PyPDF2==3.0.1 python-dateutil==2.8.2 pytz==2023.3 PyYAML==6.0 regex==2023.5.5 requests==2.29.0 six==1.16.0 SQLAlchemy==2.0.13 tenacity==8.2.2 tiktoken==0.4.0 tqdm==4.65.0 typing-inspect==0.8.0 typing_extensions==4.5.0 tzdata==2023.3 urllib3==1.26.15 yarl==1.9.2
@jlueiza
@jlueiza Жыл бұрын
reemplazalo por esto index = GPTVectorStoreIndex.from_documents(pdf, service_context=service_context)
@leocam840
@leocam840 Жыл бұрын
Que buen video, ahora me queda la duda de si esto se puede implementar en una pagina web pero ya me diste la idea para empezar con algo, gracias buen video!
@DataScienceForBusiness
@DataScienceForBusiness Жыл бұрын
sí se puede, hay un montón de conectores para diferentes tipos de información
@armandoortega3837
@armandoortega3837 3 ай бұрын
Que puedo hacer si hay diferencias entre las políticas de privacidad de mi empresa y las de chat Gpt, como puedo implementar estos modelos personalizados en materia de privacidad?
@unobuscando
@unobuscando Жыл бұрын
Cómo sacas la información resultante fuera del entorno de programación, por ejemplo en una web, otra aplicación, documento pdf o Word, hoja Excel, etc.?
@skullsp
@skullsp 2 ай бұрын
Necesito hacer esto mismo pero en una web publica. Hay algun video?
@user-fp2ng8yj1i
@user-fp2ng8yj1i 9 ай бұрын
si recontra funciona
@Furkunst
@Furkunst Жыл бұрын
Como puedo hacer lo mismo con archivo CSV?
@Artemius79
@Artemius79 Жыл бұрын
Muy buen video, todo el contenido es muy informativo. Tengo experiencia de dos años como desarrollador de software empresarial, en el área de mantenimiento, y viendo el panorama (y para seguir creciendo) he estado analizando un poco sobre este mundo del Data, y mi perfil pareciera encajar más con ingeniería de datos. Que ruta me recomiendas para lograr avances en esta área?. De momento no pienso en dejar mi empleo , sino, mejorar mi perfil actual. Muchas gracias de antemano!
@DataScienceForBusiness
@DataScienceForBusiness Жыл бұрын
no es mi especialidad pero sin duda lo siguiente lo vas a necesitar: python, java, bbdd relacionales y sql, big data: ecosistema hadoop y spark, cloud y orquestadores de flujo: airflow, ...
@jaimeluna99
@jaimeluna99 Жыл бұрын
Me parece que es una masterclass única y sin igual en todo lo que he buscado. Felicitaciones. Pregunta: como puedo integrar este resultado a una pagina web o teams corporativo? La idea es que los empleados hagan preguntas en un chat y se conecte con lanrespuesta que gera este código. Gracias y saludos.
@DataScienceForBusiness
@DataScienceForBusiness Жыл бұрын
Díselo a sistemas, no es muy complicado. Podrían crear una api sobre este script que sea llamada por la búsqueda del usuario en la aplicación y devuelva el resultado en la misma. De nuevo, cuidado con la confidencialidad, revisad bien las políticas de OpenAI y que sea complience con las de la empresa.
@camilocespedes1046
@camilocespedes1046 Жыл бұрын
Hola Isaac, muy buena tu explicación. Una cosa que me llama la atención es la capacidad de automatización que existe en los data job. ¿Crees que las IA reemplazarán en gran parte la labor humana de estos trabajos? ¡Saludos!
@DataScienceForBusiness
@DataScienceForBusiness Жыл бұрын
Al revés! creo que estamos en la mayor ventana de oportunidad en este campo en muchos años. En breve voy a publicar un vídeo explicando por qué pienso así.
@ahuaracab
@ahuaracab Жыл бұрын
Hola buen vídeo! Quería preguntarte en qué lugar puedo seguir estudios de Data Science y/o Inteligencia Artificial, ya sea bootcamp, curso, instituto, universidad, etc para adentrarme más en el tema, claro que empezaré por el recurso que facilitaste, pero luego? Gracias!
@DataScienceForBusiness
@DataScienceForBusiness Жыл бұрын
Te recomendaría mi empresa claro. Al final de tu primera semana puedes pedir información sobre el programa Python data science mastery
@bradleysandoval1323
@bradleysandoval1323 Жыл бұрын
Hola Isaac Disculpa que te moleste 😅 aparte de data science también impartes cursos adentro de tu bootcamp para data engineer amarrado con Cloud Aws? No he visto en el programa sobre SQL seguramente lo explicas pero quería quitarme la duda, me gusta mucho la forma en que explicas y nos quitas las dudas 💯
@DataScienceForBusiness
@DataScienceForBusiness Жыл бұрын
No, mi especialidad es data science y data analytics. No soy experto en data engineering
@CamiloOrejuela
@CamiloOrejuela Жыл бұрын
Muy buen video amigo. ¿Qué tal el tema de analizar datos de Excel con ChatGPT para crear informes? Es posible? Existe alguna herramienta para ello?
@DataScienceForBusiness
@DataScienceForBusiness Жыл бұрын
sí, es posible con herramientas similares a las del vídeo: gptindex, langchain. pero conociendo la implicación de microsoft en openai no creo que tarden mucho en incluirlo de manera nativa y de serie en excel
@legaldesigndo
@legaldesigndo Жыл бұрын
Pero al final has hecho un Google Colab, uno pensaría que terminaría haciendo un GUI como en la explicación del inicio.😢 Probaré usando unas librerías que convierten cuadernos en apps.
@darahmireh
@darahmireh 9 ай бұрын
Súper! Te pregunto, si quisiera añadirle un rol, ¿en qué parte del código se integra esa parte?
@DataScienceForBusiness
@DataScienceForBusiness 9 ай бұрын
Con lo que tenemos en este ejemplo concreto se lo tendrías que añadir en la pregunta. Pero en langchain hay una funcionalidad un poco más avanzada, que se llama "prompt template" con la que puedes crear prompts más avanzados, meterle cosas como el rol, o hacer que partes del prompt sean dinámicas. busca ese término
@CarlosDiazR
@CarlosDiazR 11 ай бұрын
El tema del calculo, es porque no le hiciste bien la pregunta. Siempre tienes que indicar cómo algo. "Suma todos los salarios de los consejeros y divide el resultado entre todos los consejeros de la lista para saber cual es el salario medio." Estoy seguro que te lo dice si se lo dices de esa manera.
@LadyTrunyx
@LadyTrunyx Жыл бұрын
Si usas chatgpt 4, la ultima versión, tiene para procesar 32k de datos, una barbaridad. Es decir puede analizar muchos pdfs a la misma vez. Así, que la implementación que haces en python ya no es necesaria o si lo es seria mucho más fácil.
@maltimiras
@maltimiras Жыл бұрын
Gracias por el video! Muy interestante. A mi me da error PdfReadError: EOF marker not found independientemente del pdf que le suba....
@maltimiras
@maltimiras Жыл бұрын
Igual porque estoy en Mac?
@Nukeid
@Nukeid Жыл бұрын
Hubiese sido instructivo si a la consulta que no pudo responder sobre "media de sueldos de consejeros", se cambiaba la forma de preguntar en: "busca la tabla de consejeros, suma los números el total de cada consejero y divídelo por la cantidad de consejeros". En estos modelos todavía hay aspectos que mejorar. Con la aceleración que tienen en pocos años más las interacciones serán más sencillas.
@Cieofkgkrlalvie
@Cieofkgkrlalvie Жыл бұрын
Me falla el paso de 3 from llama_index import GPTSimpleVectorIndex, SimpleDirectoryReader, LLMPredictor, ServiceContext, dice que el GPTSImpleVectorIndex no se puede instalar
@DataScienceForBusiness
@DataScienceForBusiness Жыл бұрын
Efectivamente han cambiado la clase. Para arreglarlo en el notebook: En todos los sitios donde ponía GPTSimpleVectorIndex cambiarlo por GPTVectorStoreIndex Donde ponía index.query(pregunta) cambiarlo por index.as_query_engine().query(pregunta)
@alexandrelc4361
@alexandrelc4361 Жыл бұрын
Muy interesante tu video, gracias por compartir tus conocimientos. Tengo una pregunta: ¿Chatgpt cobra por los tokens de lectura de documentos o solo cobra por los tokens de solicitud y respuesta?
@DataScienceForBusiness
@DataScienceForBusiness Жыл бұрын
Entiendo que te refieres a la api. Y lo de lectura de documentos supongo que refieres al embeding. Cobra por todo ello, pero son precios y modelos diferentes. En esta página puedes ver los diferentes modelos y sus costes: openai.com/pricing
@despertarinteri0r
@despertarinteri0r 11 ай бұрын
Muchas gracias por compartir el código y las explicaciones, ¿se pueden usar otros modelos aparte de chatGPT?
@DataScienceForBusiness
@DataScienceForBusiness 11 ай бұрын
Sí además del resto de openai también puedes usar de otros vendors como cohere, y tb opensource, por ej de HuggingFace
@hmendezg
@hmendezg Жыл бұрын
Gracias por este video. Tengo dos preguntas: 1) ¿Qué costo por el uso de la API generó el ejemplo? 2) ¿Los datos del contexto quedan al alcance de OpenAI?
@DataScienceForBusiness
@DataScienceForBusiness Жыл бұрын
Muy poco coste, 2 o 3 céntimos. Sí, lo comento en el vídeo y lo repito, cuidado con los datos. Ahora parece que están trabajando en una versión que no se quedará con los datos, pero por el momento parece que sí lo hacen. Hay que leer muy bien la policy.
@ListaUbU
@ListaUbU Жыл бұрын
funciona en simultaneo con todos los pdf q uno le suministre? cruza datos entre diferentes pdf?
@DataScienceForBusiness
@DataScienceForBusiness Жыл бұрын
langchain tiene funciones para cargar por ej todos los pdfs que tengas en una carpeta. no es que cruce datos literalmente, pero todo el contenido de los diferentes pdfs va a la misma bbdd vectorial. así que si hay info relevante para la consulta en diferentes pdfs si le llega al modelo llm y luego éste ya decide cómo combinarla para dar la respuesta
@leonfinanciero
@leonfinanciero 9 ай бұрын
Seria bueno que le metas una enciclopedia de 5000 páginas haber como funciona la cosa. Saludos amigo.
@oscar2651958
@oscar2651958 Жыл бұрын
Excelente video! Solo un tema, cuando estoy ejecutando en Collab el python, me sale el error ImportError: cannot import name 'GPTSimpleVectorIndex' from 'llama_index' (/usr/local/lib/python3.10/dist-packages/llama_index/__init__.py) Alguna idea? creo que fue cambiado el GPTSimpleVectorIndex ? Agradecere su ayuda ...
@DataScienceForBusiness
@DataScienceForBusiness Жыл бұрын
Efectivamente han cambiado la clase. Para arreglarlo en el notebook: En todos los sitios donde ponía GPTSimpleVectorIndex cambiarlo por GPTVectorStoreIndex Donde ponía index.query(pregunta) cambiarlo por index.as_query_engine().query(pregunta)
@pablobraojos
@pablobraojos Жыл бұрын
@@DataScienceForBusiness La primera correcion funciona biem, pero al poner index.query(pregunta) o index.as_query_engine().query(pregunta) da problemas... Graciasss de antemano
@VictorFernandez-wf5lj
@VictorFernandez-wf5lj Жыл бұрын
@@DataScienceForBusiness me sucedia igual y ya funciona, muchas gracias
@maoramirez10
@maoramirez10 Жыл бұрын
Excelente información no se si se me paso por alto en el vídeo pero hay algun límite o cantidad de gigas que podamos subir en formato PDF?
@ivan321pum
@ivan321pum Жыл бұрын
Creo que eran 2000 páginas o algo así
@DataScienceForBusiness
@DataScienceForBusiness Жыл бұрын
no lo he llevado al límite, pero por cómo funciona entiendo que no. pero ten en cuenta el coste, a más tamaño más coste
@crearelectronica
@crearelectronica Жыл бұрын
Exelente vídeo... Al utilizar ése servicio la información está en los servidores de ellos o se instala en un servidor propio?
@DataScienceForBusiness
@DataScienceForBusiness Жыл бұрын
En este caso en los de Google y en los de OpenAI
@carlosarrasco
@carlosarrasco 9 ай бұрын
Una consulta, mencionaste que openai te daba $5, eso significa que el uso de su servicio es limitado hasta un cierto número de consultas? Y luego habria que pagar? Muchas gracias por el vídeo y la información, se aprecio mucho su esfuerzo!!
@DataScienceForBusiness
@DataScienceForBusiness 9 ай бұрын
Correcto, al menos eso te daban en el momento que hice el vídeo, no sé si ahora habrá cambiado. Pasado ese límite ya tienes que meter una tarjeta si quieres seguir usándolo.
@jordannolasco1527
@jordannolasco1527 Жыл бұрын
Hola, una pregunta, con la IA, que se puede estudiar para no quedar obsoletos con el tiempo, porque he visto que ya lo está haciendo
@DataScienceForBusiness
@DataScienceForBusiness Жыл бұрын
Gran pregunta. Creo que hay 2 partes: lo que tiene que aprender un profesional, que implica frameworks, librerías, etc. Y lo que tiene que aprender una persona "normal" de cualquier otro trabajo, que implica herramientas finales de usuario como chatgpt, midjourney, etc. Lo apunto para un vídeo
@ERUANNU
@ERUANNU Жыл бұрын
Existe un error en el codigo y no encuentro como corregirlo. Esta en la linea 3 del cuando se llama a llama_index
@DataScienceForBusiness
@DataScienceForBusiness Жыл бұрын
Efectivamente han cambiado la clase. Para arreglarlo en el notebook: En todos los sitios donde ponía GPTSimpleVectorIndex cambiarlo por GPTVectorStoreIndex Donde ponía index.query(pregunta) cambiarlo por index.as_query_engine().query(pregunta)
@VictorFernandez-wf5lj
@VictorFernandez-wf5lj Жыл бұрын
Muy interesante, en el directorio de datos, podrían ser otros formatos, no sólo pdf, no?
@DataScienceForBusiness
@DataScienceForBusiness Жыл бұрын
Sí, llamaindex tiene un montón de conectores para diferentes formatos
@VictorFernandez-wf5lj
@VictorFernandez-wf5lj Жыл бұрын
Pero en el ejemplo del notebook, no se cita el formato de los documentos en ningún sitio
@bernietgn6406
@bernietgn6406 Жыл бұрын
Gracias por el vídeo. Muy instructivo. Dime, por favor, que ese código para la API es falso y no funciona... 😅
@DataScienceForBusiness
@DataScienceForBusiness Жыл бұрын
sí sí funciona. pica los dígitos uno a uno y comprúebalo. quizá la primera vez no, pero hazlo 10 veces y seguro que va ;-) ... ... nota: por si acaso alguien no lo pilla que no lo intente, era una broma
@user-eb2hs7oj7r
@user-eb2hs7oj7r Жыл бұрын
si quisieras ponerlo en una interfaz grafica como lo harías?
@DataScienceForBusiness
@DataScienceForBusiness Жыл бұрын
si es solo para prototipar puedes usar streamlit o gradio. si es nivel más empresarial puedes crear una api que sea llamada por la aplicación web
@om4le
@om4le Жыл бұрын
una consulta por que no me deja descargar el notebook de codigos? me dice que no tengo ninguna aplicación que pueda abrirla
@DataScienceForBusiness
@DataScienceForBusiness Жыл бұрын
es un notebook, tienes que abrirlo con Colab, Jupyter, Vscode, etc
@om4le
@om4le Жыл бұрын
@@DataScienceForBusiness muchas gracias, pude abrirlo y hacer el ejercicio como tú. Solo que me daba error en el Index
@alexhurtadomktd
@alexhurtadomktd Жыл бұрын
Super interesante, quiero aprender ha hacer esto para conectarlo a un chatbot de Whatsapp. Podria lograrlo a traves de una API? o que ruta deberia seguir?
@DataScienceForBusiness
@DataScienceForBusiness Жыл бұрын
estos servicios suelen operativizarse mediante apis
@alexhurtadomktd
@alexhurtadomktd Жыл бұрын
@@DataScienceForBusiness Tal ves debo explicarme más. ósea un mejor promt, para lograr una respuesta más satisfactoria. Yo implemento chatbots con plataformas como chatrace, uchat, manychat, etc estas tiene un bloque que se llama solicitud externa que trabaja a partir de APIS; entonces quisiera realizar la pregunta desde whatsapp, que esta consulta se la entregue en el google colab que acabas de enseñar y que retorno que la respuesta al mismo chatbot para entregarsela al usuario que realizo la consulta, es este escenario conversacional que no se como se podria lograr o que ruta deberia seguir para lograrlo. De antemano agradezco cualquier guia.
@judexmx
@judexmx Жыл бұрын
Qué pasa con la información que se carga en relación con la privacidad de la información?
@DataScienceForBusiness
@DataScienceForBusiness Жыл бұрын
lo comento en el vídeo. de momento no recomiendo cargar info sensible. hay iniciativas que están trabajando para mejorar en ese sentido.
@vktop2
@vktop2 Жыл бұрын
Hola muy buien video, pero la verdad no me funciono, subi un PDF de 23 paginas sobre la nube y cada vez que le hago una pregunta me da el error de que mi pregunta genero mas tokens que 4096 y a apesar de que le haga una pregunta muy pequeña de temas que no ocupan mas que un par de parrafos en le PDF me da el mismo error. Saludos
@DataScienceForBusiness
@DataScienceForBusiness Жыл бұрын
ese error también se puede dar por acumulación de preguntas. Es decir, cuando vas haciendo preguntas, aunque sean pequeñas, va formando un contexto de la conversación. si pasas el límite puede dar ese error. si te pasa prueba a salir y empezar otra conversación.
@vktop2
@vktop2 Жыл бұрын
​@@DataScienceForBusiness Muchas gracias por la respuesta ya encontre lo que fallaba el archivo PDF era muy grande, pero puse un archivo PDF más pequeño y funcionó y lei que es una limitación del modelo que actualmente solo funciona con 4097 tokens y los tokens, lo que recomiendan es partir los archivos grandes en archivos más pequeños. Gracias, saludos
@leonfinanciero
@leonfinanciero 9 ай бұрын
Tiene aún algunas fallas, pero seguro con el tiempo perfeccionan más a estas maqinas.
@franprimolarry
@franprimolarry Жыл бұрын
Tengo una cuestión, el hecho de importar toda la información de negocio a ChatGPT ¿vulneraría la privacidad de datos?. ¿Cómo podríamos mantener los datos a salvo utilizando ChatGPT?
@DataScienceForBusiness
@DataScienceForBusiness Жыл бұрын
La info que le metes puede ser usada para reentrenar sus modelos (ahora están metiendo opciones para que puedas bloquear esto). Por eso como digo en el vídeo hay que leer bien la política de Openai y saber lo que le metes, tanto en la api como en el propio Chatgpt. En el corto plazo estoy seguro de que las empresas incorporarán versiones propias y locales de LLMs para poder hacer estos usos de forma escalable y segura.
@sgnshogun
@sgnshogun Жыл бұрын
Hola @@DataScienceForBusiness! Felicidades por el video, super interesante!! Tienes algún enlace o recurso donde explique como montar una LLMs local? Me interesa mucho este punto. Gracias!
@millernavia7697
@millernavia7697 Жыл бұрын
@@DataScienceForBusiness Hola, genial el video, mil y mil gracias estoy ejecutando el codigo y en un momento creo que me dio error por creditos, pero no es claro si es de Openia o de google. RateLimitError: You exceeded your current quota, please check your plan and billing details. The above exception was the direct cause of the following exception: sabes que peude ser?
@MG-bm5oj
@MG-bm5oj Жыл бұрын
Nadie tiene este error: DependencyError: PyCryptodome is required for AES algorithm
@cesarcomanducci4098
@cesarcomanducci4098 Жыл бұрын
Se podrá hacer con excel?
@DataScienceForBusiness
@DataScienceForBusiness Жыл бұрын
Si te refieres al motor de NLP obviamente no. Si te refieres a que excel sea el cliente desde el que haces la consulta, no lo he probado, pero a priori creo que si creas una api para el modelo y la llamas desde power query funcionaría.
@salitoprincesa
@salitoprincesa Жыл бұрын
Con excel se le puede ordenar generar código visualbasic y hacer macros de programación. En mi opinión hay que ser MUY ESPECÍFICO con lo que se quiere, identificar las variables y espectativas. Lee varios códigos de programación
@adan8657
@adan8657 Жыл бұрын
No he estado en una cueva, más bien he querido meterme en una.😢 Es broma, hay que adaptarse a los cambios más que nunca.
@CristhoferTravieso
@CristhoferTravieso Жыл бұрын
Cuidado que openAI es dueño de todo lo que sí ingrese a chatgpt , ya pasó que se fiktro codigo de un software
@NickBPalomino
@NickBPalomino Жыл бұрын
tienes el link de esa noticia? me interesa
@scdnet
@scdnet Жыл бұрын
Muy largo el video, no se entiende nada. Muy agotador
@Pepitopagadoble
@Pepitopagadoble 7 ай бұрын
Hola gracias por el video muy bueno! me sale un error cuando ejecuto, la indexaciones de los contenidos de los pdf. Tiene que ver con que se supone que excedi los limites de la API, pero cuando reviso en opein AI no tengo usado nada de los $18 que tengo disponible: WARNING:llama_index.llms.openai_utils:Retrying llama_index.embeddings.openai.get_embeddings in 0.13479332341987815 seconds as it raised RateLimitError: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}. ---------------------------------------------------------------------------
@alfredocentarini6241
@alfredocentarini6241 Жыл бұрын
nose por que no funciona en visualCode🥲
@DataScienceForBusiness
@DataScienceForBusiness Жыл бұрын
Posiblemente no sea visualcode si no tu entorno local. Creo que lo había comentado en el vídeo (quizá lo quité en la edición final para hacerlo más corto) pero recomiendo hacerlo en Colab pq estos temas tan nuevos suelen dar problemas de "fontanería", q normalmente Google los tiene mejor resueltos que un usuario en local.
@alfredocentarini6241
@alfredocentarini6241 Жыл бұрын
@@DataScienceForBusiness si, pense lo mimso, en colab funciona muy bien. gracias
Cómo usar CHATGPT (api) sobre la base de datos de tu Empresa [Y te regalo la APP]
17:13
Fine-tuning a GPT3 Para Que Haga Lo Que Sea
16:42
AMP Tech
Рет қаралды 34 М.
路飞被小孩吓到了#海贼王#路飞
00:41
路飞与唐舞桐
Рет қаралды 46 МЛН
孩子多的烦恼?#火影忍者 #家庭 #佐助
00:31
火影忍者一家
Рет қаралды 48 МЛН
Looks realistic #tiktok
00:22
Анастасия Тарасова
Рет қаралды 71 МЛН
Descubre las 3 CLAVES para girar a DATA SCIENCE a partir de los 40 [🎧Podcast]
34:50
¡Nuevos Custom GPTs: El Multiverso de ChatGPT!
17:08
Dot CSV
Рет қаралды 229 М.
¿Cómo funciona ChatGPT? La revolución de la Inteligencia Artificial
50:45
Aprende sobre Embeddings de OpenAI
22:08
AMP Tech
Рет қаралды 48 М.
Testing out OLLAMA - Your own ChatGPT locally! [ENGLISH SUBTITLES]
14:40
Top consejos si quieres ser Freelance en Data Science
51:20
DataScience ForBusiness
Рет қаралды 28 М.
¿Cómo aprovechar al máximo ChatGPT?
34:15
Santiago Bilinkis
Рет қаралды 56 М.
ИГРОВОВЫЙ НОУТ ASUS ЗА 57 тысяч
25:33
Ремонтяш
Рет қаралды 344 М.