Пікірлер
@theanhbui4259
@theanhbui4259 6 күн бұрын
Good job!
@monkitvn8531
@monkitvn8531 8 күн бұрын
Bạn ơi nếu được bạn làm video về thiết kế giao diện phần mềm và đóng gói thành tool. Cảm ơn bạn.
@PhướcNguyễn-y6s
@PhướcNguyễn-y6s 8 күн бұрын
Cảm ơn anh về video.
@Lunalevi-toan
@Lunalevi-toan 20 күн бұрын
🥰🥰🥰 super hay luôn ạ. Cảm ơn anh!
@nguyenhoangson42
@nguyenhoangson42 20 күн бұрын
Cho mình hỏi là Data scientist ở Nhật có nhu cầu tuyển dụng cao không ạ?
@NAVYVU-u3k
@NAVYVU-u3k 24 күн бұрын
Trong trường hợp em cơ sẵn data đang lưu trên Elasticsearch thì mình cơ thể đưa dữ liệu này vào thay cho việc upload file đc ko ạ.
@_PhamThienTai
@_PhamThienTai 25 күн бұрын
Dạ em xin cảm ơn video của anh rất hữu ích. Dạ anh cho em hỏi làm ngoài lấy API từ OpenAI ra thì còn giải pháp nào rẻ hơn không ạ ? Em xin cảm ơn.
@hoa-moc-lan3048
@hoa-moc-lan3048 17 күн бұрын
api của gemini
@HaNguyen-mc1tm
@HaNguyen-mc1tm 27 күн бұрын
Em chào anh, Vì thực sự clip rất hay nên em có lục lại cả các clip khác của anh nữa, thì em thấy có 1 clip anh nói về kiểm định thống kê, AB test, p-value - lạii đúng là phần em đang học cho 1 project liên quan tới classification. Vì background của em về data science/ model AI nói chung còn khá yếu nên accuracy khi train model (em đang sử dụng các model ML truyền thống như kNN, naive Bayes,...) chưa được cao. Do đó liệu em có thể xin contact anh để có thể nhờ anh tư vấn 1 chút được không ạ. Em cảm ơn anh rất nhiều
@ucphatbui4233
@ucphatbui4233 28 күн бұрын
Anh ơi khi e import api key của e thì nó hiện ra lỗi này ạ: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. Vậy là phải update account openai mới được link api đúng không ạ?
@ducducc529
@ducducc529 28 күн бұрын
anh ơi em làm đến 30:40 thì bị lỗi Segmentation fault: 11 là sao ạ, mong anh giải đáp ạ
@quiz1112
@quiz1112 28 күн бұрын
Những phần tính toàn phức tạp hơn như đang dùng trên SPSS phân tích đa biến hay forecast thì có chạy được không nhỉ?
@animalgenerative
@animalgenerative 29 күн бұрын
Hi anh! khi em tạo thử cái notebooks Thì bị thông báo lỗi như: --------------------------------------------------------------------------- ModuleNotFoundError Traceback (most recent call last) Cell In[1], line 1 ----> 1 from langchain_experimental.agents.agent_toolkits.pandas.base import create_pandas_dataframe_agent 2 from langchain_openai import ChatOpenAI 3 import matplotlib.pyplot as plt ModuleNotFoundError: No module named 'langchain_experimental' Trong khi em đã import ngay từ đầu ở file rqm.txt rùi ạ, trường hợp này là có bị confilic ở đâu đó không anh
@codewithvika
@codewithvika 29 күн бұрын
cho em xin file csv với ạ
@nguyenhads
@nguyenhads 28 күн бұрын
A để ở link trên github nha. Đường link đây: github.com/datasciencelab-ai/dagpt/blob/main/data/sample_data.csv
@Sonnie_Tran
@Sonnie_Tran 29 күн бұрын
Hình như Google cũng có NotebookLM để xử lí dữ liệu offline như thế này. Chỉ là nó không có bộ visual hóa dữ liệu như cái này thôi
@nguyenhads
@nguyenhads 28 күн бұрын
Cám ơn bạn đã chia sẻ thông tin. Bạn có thể share thêm chi tiết ko như đường link chẳng hạn
@AnhTuấnNguyễn-g3z
@AnhTuấnNguyễn-g3z Ай бұрын
Hay quá anh ơi, đỉnh của đỉnh. Mà anh có thể làm thêm 1 option vs gemini api được không anh?
@nguyenhads
@nguyenhads 28 күн бұрын
Cám ơn em. Nếu có thời gian a sẽ update. Hoặc nếu em rảnh thử vọc xem sao, a nghĩ sẽ học thêm được nhiều đó
@AnhTuấnNguyễn-g3z
@AnhTuấnNguyễn-g3z 28 күн бұрын
​@@nguyenhads Dạ, em có làm thử rồi á anh, coi đi coi lại video của anh, em cũng làm được rồi. Chúc anh có nhiều sức khỏe để ra được nhiều video hơn ạ.
@tranquanghuy8679
@tranquanghuy8679 Ай бұрын
A ơi, em muốn làm một dashboard tự động cập nhật dữ liệu từ data cào trên web về thì các bước như nào a, em cào bằng Python rồi xử lý xong lưu vào sql rồi cho tableau vào lấy dữ liệu ra nhưng không biết làm tự động với lại quy trình như thế không biết đúng không nữa😢
@nguyenhads
@nguyenhads 28 күн бұрын
Anh thấy qui trình của em cũng tương đối đúng rồi. Qui trình tổng quan anh nghĩ như này: Crawl dữ liệu -> Xử lý dữ liệu trước khi đưa vào db -> Lưu trữ dữ liệu trong cơ sở dữ liệu hoặc file csv -> Tạo dashboard -> Tự động hoá qua scheduling -> Cập nhật dashboard tự động. Tự động hóa quy trình qua scheduling em có thể sử dụng Airflow hoặc Cron để lập lịch crawl dữ liệu tự động theo chu kỳ. Airflow cung cấp giao diện quản lý DAGs (quy trình làm việc) rất dễ. Anh nghĩ dự án này rất hay nhưng cũng cần phải học cách sử dụng nhiều tool. Chúc em thành công
@tuanvo9526
@tuanvo9526 Ай бұрын
thank Hà, đã xong bài 40
@nguyenhads
@nguyenhads 28 күн бұрын
Cám ơn bạn. Keep going nha
@bint6592
@bint6592 Ай бұрын
Dạ rất cảm ơn anh đã chia sẻ một chiếc vidieo cực kì hữu ích ạ. Dạ không biết bài này mình có thể phát triển lên các chức năng khác ví dụ như phân cụm dữ liệu, xử lí null hay missing data,... và sẽ gửi lại một bản csv mới với các thao tác người dùng vừa yêu cầu không ạ. Một lần nữa cảm ơn anh vì chia sẻ của anh ạ <3
@nguyenhads
@nguyenhads Ай бұрын
create_pandas_dataframe_agent hoàn toàn hỗ trợ những thao tác trên em vừa mô tả nhé. Em có thể tự mình vọc vạch thêm, việc tự mình vọc vạch anh nghĩ sẽ giúp ích cho việc học của em rất nhiều. chúc em học tập hiệu quả
@PhướcNguyễn-y6s
@PhướcNguyễn-y6s Ай бұрын
Cảm ơn anh. Anh cho hỏi thay thế LLM model Gemini của Google được ko anh?
@nguyenhads
@nguyenhads Ай бұрын
Có em nhé, tuy nhiên phần code có thể sẽ phải thay đổi đôi. Anh chưa test, em có thể test thử và chia sẻ với anh nha
@PhướcNguyễn-y6s
@PhướcNguyễn-y6s Ай бұрын
@@nguyenhads Em test thử với VertexAI: - Load data: ok - Query:" Describe this data" nó không ra kết quả theo kiểu dữ liệu mà ra text như bên dưới anh: Chat History: Query: 1: describe this data Response: 1: The data consists of sales information from 7-Eleven stores in Osaka, Japan. Each row represents a sales record, including: Store Name: The name of the store (currently only "7-Eleven" is present). Date: The date of the sale. Product: The type of product sold (e.g., "Bakery", "Beef Bowl"). Unit Price: The price of a single unit of the product. Sales: The number of units sold. Revenue: The total revenue generated from the sale (Unit Price * Sales). Stock Quantity: The quantity of the product in stock. Profit: The profit made from the sale. Store Address: The address of the store. Postal Code: The postal code of the store. The data shows sales figures for at least two product types ("Bakery" and "Beef Bowl") over a period of several months in 2023. The dataset is limited to a single store in the provided sample.
@PhướcNguyễn-y6s
@PhướcNguyễn-y6s Ай бұрын
Em dùng Query: describe this data using df.descibe() thì báo lỗi như bên dưới nè anh. An error occurred: Additional kwargs key avg_logprobs already exists in left dict and value has unsupported type <class 'float'>.
@PhướcNguyễn-y6s
@PhướcNguyễn-y6s 29 күн бұрын
@@nguyenhads Em đã test với ChatGoogleGenerativeAI của Google được rồi anh. Mình muốn thêm chức năng kiểu như load df vào nhập query xử lí null và trả ra df đã xử lí trong dự án này được không anh.
@nguyenhads
@nguyenhads 28 күн бұрын
@@PhướcNguyễn-y6s Em thử tạo 1 notebook mới và chạy câu lệnh anh để bên dưới xem . có lỗi không nha. Nếu lỗi em chia sẻ phần log đó ở đây cho a. import pandas as pd # Sample data data = {'A': [1, 2, 3, 4, 5], 'B': [5, 6, 7, 8, 9]} df = pd.DataFrame(data) # Test describe print(df.describe())
@alexstarted7247
@alexstarted7247 Ай бұрын
biết anh sớm có khi giờ em thành chuyên gia rồi.
@ngocquy5877
@ngocquy5877 Ай бұрын
data engineer thì có phù hợp ko anh
@nguyenhads
@nguyenhads Ай бұрын
em hỏi câu này chung quá nên anh khó trả lời. tuy nhiên anh để thông tin bổ sung thông tin về các công việc chi tiết của ngành data science ở dưới. em có thể tham khảo xem có phù hợp với sở thích, thế mạnh và mong muốn nghề nghiệp của em không nha.
@nguyenhads
@nguyenhads Ай бұрын
Data Engineer: - Vai trò chính: Xây dựng và duy trì hệ thống hạ tầng dữ liệu, bao gồm thu thập, lưu trữ và xử lý dữ liệu. - Kỹ năng cần thiết: Lập trình (Python, Java, Scala), cơ sở dữ liệu (SQL, NoSQL), các công cụ xử lý dữ liệu lớn (Apache Spark, Hadoop), và các dịch vụ điện toán đám mây (AWS, Azure, Google Cloud). - Công việc hàng ngày: Thiết kế pipelines dữ liệu, tối ưu hóa quá trình truyền tải và xử lý dữ liệu từ các nguồn khác nhau, đảm bảo dữ liệu luôn sẵn sàng cho phân tích và mô hình hóa. - Đặc điểm nghề: Phù hợp với những ai có sở thích về lập trình, xây dựng hệ thống, và giải quyết các vấn đề về hiệu suất. Data Analyst: - Vai trò chính: Phân tích dữ liệu để rút ra thông tin chi tiết và cung cấp báo cáo giúp các doanh nghiệp ra quyết định. - Kỹ năng cần thiết: Phân tích dữ liệu bằng Excel, SQL, Python hoặc R, các công cụ trực quan hóa dữ liệu (Tableau, Power BI), và khả năng giao tiếp tốt để trình bày các phát hiện. - Công việc hàng ngày: Thu thập, xử lý, và trực quan hóa dữ liệu, tạo báo cáo chi tiết để giúp các bộ phận ra quyết định chiến lược. - Đặc điểm nghề: Phù hợp với những ai yêu thích làm việc với số liệu, có tư duy phân tích và mong muốn tạo ra giá trị thông qua phân tích. Data Scientist: -Vai trò chính: Xây dựng mô hình dự đoán và giải quyết các bài toán phức tạp bằng các thuật toán máy học (Machine Learning) và trí tuệ nhân tạo (AI). - Kỹ năng cần thiết: Kiến thức toán học, thống kê, kỹ năng lập trình (Python, R), và kiến thức về Machine Learning, Deep Learning. Khả năng giao tiếp để diễn giải kết quả phân tích cũng rất quan trọng. - Công việc hàng ngày: Phân tích dữ liệu, xây dựng mô hình dự đoán, tối ưu hóa thuật toán, và cộng tác với các bộ phận khác để triển khai giải pháp AI. - Đặc điểm nghề: Phù hợp với những ai yêu thích giải quyết các vấn đề phức tạp, có niềm đam mê với toán học, và muốn áp dụng các mô hình tiên tiến vào thực tiễn.
@nguyenhads
@nguyenhads Ай бұрын
Data Engineer giống như người chuẩn bị nguyên liệu, chịu trách nhiệm thu thập và xử lý dữ liệu (nguyên liệu) để sẵn sàng cho việc sử dụng. Data Analyst giống như đầu bếp chế biến các món ăn cơ bản, sử dụng dữ liệu đã xử lý để tạo ra các báo cáo và kết quả phân tích theo công thức có sẵn. Data Scientist là đầu bếp sáng tạo, dùng dữ liệu để xây dựng mô hình và giải quyết các vấn đề phức tạp, giống như sáng tạo ra những món ăn mới độc đáo không theo công thức định sẵn. Hi vọng em có hình dung tổng quan về các công việc trong ngành data science và chọn được công việc phù hợp với em.
@tuanhoangvan8132
@tuanhoangvan8132 Ай бұрын
Hay quá. Cảm ơn bạn đã chia sẻ
@AnhTuan-xh7hd
@AnhTuan-xh7hd Ай бұрын
Hay quá ạ. Đỉnh nóc kịch trần <3
@tuanvo9526
@tuanvo9526 Ай бұрын
Thank Hà, rất dễ hiểu. anh làm bài 19-20 như sau: ( df_receipt[["customer_id", "amount"]] .assign(ranking=df_receipt["amount"].rank(method="min", ascending=False).astype(int)) #.assign(rank=df_receipt["amount"].rank(method="first", ascending=False).astype(int)) .sort_values("ranking") .head(10) )
@ThanhTran27507
@ThanhTran27507 Ай бұрын
rất hay ạ
@gosingabke.cdsongtutegnh
@gosingabke.cdsongtutegnh Ай бұрын
Hỏi đáp trên dữ liệu bảng, là có hỏi đáp trên tập dataset lớn tầm 5000-10000 dòng được không ạ. Cảm ơn anh đã share ạ
@nguyenhads
@nguyenhads Ай бұрын
a nghĩ không có vấn đề gì, trong clip a sử dụng mô hình gpt-3.5-turbo a thấy kết quả cũng khá ổn, tuy nhiên nếu dữ liệu lớn hơn hoặc phức tạp hơn em có thể thử mô hình gpt-4 và tối ưu prompt đưa vào
@CoffeeTran18
@CoffeeTran18 Ай бұрын
Rất hay anh ạ, phù hợp để vọc vạch lúc rảnh. Chúc anh nhiều sức khỏe, đợi chờ những video mới nhất từ anh
@nguyenhads
@nguyenhads Ай бұрын
Cám ơn em. chúc em học tập hiệu quả.
@phamcongtoan1399
@phamcongtoan1399 Ай бұрын
Người mới thì học nguồn nào z a
@nguyenhads
@nguyenhads Ай бұрын
Em nói chi tiết hơn là học về vấn đề gì. Ví dụ GenAI, LLM, Machine Learning truyền thống, Deep Learng etc thì anh sẽ dễ tư vấn hơn
@phamcongtoan1399
@phamcongtoan1399 Ай бұрын
@@nguyenhads Machine learning ạ
@nguyenhads
@nguyenhads Ай бұрын
​@@phamcongtoan1399 Ở Việt Nam thì anh thấy có AI VietNam cung cấp 1 chương trình rất tổng quan học về AI nói chung bao gồm cả Machine Learning. Về nguồn học thì anh recommend em các khoá học của Andrew Ng trên Coursera. Cụ thể anh thấy course này rất hay cho người mới bắt đầu www.coursera.org/specializations/machine-learning-introduction. Ngoài việc học course học ra thì Kaggle là nơi thực hành và học từ code của người khác. em có thể tìm hiểu thêm về Kaggle và tham gia thử xem sao
@phamcongtoan1399
@phamcongtoan1399 Ай бұрын
@@nguyenhads em cảm ơn a nhìu ạ
@MinhTriếtLê-f3q
@MinhTriếtLê-f3q Ай бұрын
Công đức vô lượng bạn ơi.
@phamcongtoan1399
@phamcongtoan1399 Ай бұрын
anh ơi, cho em hỏi em muốn học ML thì cần những kiến thức toán học nào ạ?
@nguyenhads
@nguyenhads Ай бұрын
Câu hỏi này của em hơi rộng, nên câu trả lời của anh có thể không cụ thể được. Nhưng tổng quan thì em cần kiến thức toán về xắc xuất và thống kê, tiếp theo nữa là về đại số tuyến tính, Matrix Calculus và 1 số kiến thức về toán tối ưu nếu đi sâu hơn. A có tìm được 1 link github tổng hợp về toán cho ML. Em có thể tham khảo: github.com/dair-ai/Mathematics-for-ML
@phamcongtoan1399
@phamcongtoan1399 Ай бұрын
@@nguyenhads em cảm ơn a nhìu ạ
@SangNguyen-bu8xd
@SangNguyen-bu8xd Ай бұрын
tuyệt vời xong chủ đề về giải bài tập này mong anh sẽ ra các chủ đề khác sâu hơn về data science
@nguyenhads
@nguyenhads Ай бұрын
ok em, anh sẽ đi sâu về dự án data science. nhưng đầu tiên kiến thức cơ bản về xử lý dữ liệu là cần thiết nên em cố gắng thực hành nhiều để dễ tiếp cận hơn trong những dự án sau
@SangNguyen-bu8xd
@SangNguyen-bu8xd Ай бұрын
@@nguyenhads dạ oki anh
@17minhkha68
@17minhkha68 Ай бұрын
anh ơi, em muốn coi những video cũ mà anh chữa bài cho chị nào ấy thì có được không ạ, mong anh share cho em ạ, em cảm ơn anh nhiều
@nguyenhads
@nguyenhads Ай бұрын
Em có thể nói chi tiết hơn về nội dung được không để anh tìm lại
@17minhkha68
@17minhkha68 Ай бұрын
@@nguyenhads dạ em có lưu lại mà k để ý nội dung, em chỉ nhớ sơ là anh sửa bài tập cho chị học viên hay sao á
@trimai1156
@trimai1156 Ай бұрын
Cảm ơn anh
@17minhkha68
@17minhkha68 Ай бұрын
Đợi chờ anh ra phần mới
@quocbaonguyen5624
@quocbaonguyen5624 Ай бұрын
Cảm ơn anh <3
Ай бұрын
Chào a, e cũng đang làm việc ở Nhật và học chuyển ngành DS, a có group nào để chia sẻ kiến thức cũng như kinh nghiệm làm việc bên Nhật k ạ
@nguyenhads
@nguyenhads Ай бұрын
Chào em, trên facebook có nhóm Đi làm tại Nhật - VPJ chia sẻ kinh nghiệm đi làm nói chung ko cụ thể ngành nào. Còn về chuyên môn thì a sử dụng trang Quiita của Nhật.
@kenzom2424
@kenzom2424 Ай бұрын
Cám ơn ạ
@17minhkha68
@17minhkha68 2 ай бұрын
Em chào anh ạ, em rất thích series 100 bài tập master data science của anh cũng như ngưỡng mộ những gì anh chia sẻ cho cộng đồng, em hy vọng anh ra tập đều đều cho series này và chúc anh được nhiều sức khoẻ. Cảm ơn vì những chia sẻ của anh ạ
@nguyenhads
@nguyenhads 2 ай бұрын
Cám ơn em. Có những comment như của em sẽ giúp anh có động lực hơn rất nhiều.
@phucphanoct24
@phucphanoct24 2 ай бұрын
Giảng viên đẹp trai quá, cơ mà giọng hơi BD :v
@nguyenhads
@nguyenhads 2 ай бұрын
vâng, a Phúc manly
@kenzom2424
@kenzom2424 2 ай бұрын
eheh vào like để mốt học. Cám ơn anh nhiều.
@anhnguyen-jb7uz
@anhnguyen-jb7uz 2 ай бұрын
rất hữu ích
@nguyenhads
@nguyenhads 2 ай бұрын
thank you
@namnguyen-ih6zg
@namnguyen-ih6zg 2 ай бұрын
cảm ơn anh rất nhiều ạ <3
@nghiatran1509
@nghiatran1509 2 жыл бұрын
Xin hỏi bạn có dạy cách chuyển database từ XBRL sang MS Access không ?
@nguyenhads
@nguyenhads Ай бұрын
Chào bạn, mình không dạy cách chuyển database từ XBRL sang MS Access. Mình chỉ tập trung vào những công việc liên quan đến phân tích dữ liệu và xây dựng mô hình sử dụng python.
@linhkutotv1361
@linhkutotv1361 2 жыл бұрын
a ơi trong pandas a chỉ cho e lệnh làm sao để vẽ biểu đồ sao nó hiển thị được cột time không a
@nguyenhads
@nguyenhads Ай бұрын
Em muốn hiển thị trục x là cột thời gian còn trục y là giá trị bình thường hay sao em. Nếu em đưa chi tiết hơn về data của em hoặc code của em anh có thể giúp em viết code hoặc sửa code.
@trangbap13
@trangbap13 3 жыл бұрын
Em chào anh Hà, em cảm ơn anh chị rất nhiều vì dự án này rất bổ ích cho người mới bắt đầu tìm hiểu về DS như em. Nhờ học và làm theo video em đã hoàn thành project này rồi ạ. Em muốn hỏi là anh có thể chia sẻ nguồn code của dự án A/B test 3 phần được không ạ? Em cảm ơn anh chị rất nhiều.
@nguyenhads
@nguyenhads 3 жыл бұрын
Chào em, cám ơn em đã xem clip. Anh cũng mới tạo kênh nên chưa có thời gian để update. A sẽ update sớm. Trong thời gian tới a cũng sẽ làm thêm những project học data science qua dự án thực tế như này. Nếu em thấy có ích thì chia sẻ cho bạn bè ha.
@trangbap13
@trangbap13 3 жыл бұрын
Dạ vâng ạ. Em sẽ tiếp tục follow những dự án sắp tới và chia sẻ cho mấy đứa bạn của em ạ.
@dungvu-fm8uq
@dungvu-fm8uq 3 жыл бұрын
Ôi hay quá ạ