파란 공의 미래를 예측한다!?!

  Рет қаралды 11,682

MuJiRaengI

MuJiRaengI

Күн бұрын

Пікірлер: 130
@손재성-w5h
@손재성-w5h 2 ай бұрын
주어진 맵 전체를 탐색해야하는, 로봇청소기 등에는 효과적일 수 있으나 우리가 원하는 '효율적인 클리어'를 학습시키고자 한다면 클리어까지 도달하는 것에 걸리는 시간에 보너스, 사망 횟수에 페널티 부여가 우선되어야 할 것 같습니다.
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
오! 좋은 의견 감사합니다! 주신 의견 참고해보겠습니다!
@함동규-u8b
@함동규-u8b 2 ай бұрын
역팩맨 아이디어 2부분에 관하여... 각 패널티 및 보상이 유도 하는 A.I의 행위를 예상하자면.. 사망 패널티가 크면 클수록 A.I는 위험지대에 가기 싫어 할 것이고 그렇다고 작으면 작을수록 A.I는 파란공을 무시할 가능성이 높아집니다. 왕복시 감점이 높으면 높을수록 A.I는 갔던곳을 가지 않으려 할것입니다. 다만, 사망패널티보다 많아질 경우 돌아가지 않는걸 죽지 않는것보다 우선하기에 문제가 발생할수 있습니다.(예: 피해야 하는데 그곳이 왕복지점이여서 그낭 죽기를 택함) 모험시 가산이 높을수록 A.I는 최장거리를 탐색할 가능성이 높아집니다. 그렇다고 적으면 위험지대에 가려고 하지 않을 것입니다. 골인시 가산은 높을수록 A.I에게 골인을 할것을 강하게 유도합니다. 영상에서 어쨌거나 코인을 다 먹기 전까지는 A.I가 이득을 취하므로 역팩맨 아이디어2는 A.I가 가능한 많은 곳을(=최장거리를) 왕복없이 이동하는 경로를 찾을것입니다. 때문에 역팩맨 아이디어 1과 2를 결합하여 코인를 먹을수록 골인시 가산점과 코인의 가산점을 줄이는 방식을 채택하는것이 좋아 보입니다. 다만, 골인시 가산은 코인을 다 먹어도 매우 높은 값을 지녀야 할 것입니다. 그렇지 않으면 A.I는 골인의 위대함을 깨우치지 않고 그냥 맵만 이동할 것입니다. 마치 영상처럼요. 또한 골인시 얻는 점수량의 감점량은 코인으로 얻는 점수량보다 커야 합니다. 그렇지 않으면 A.I는 최장거리를 탐색하여 골인할 것입니다. [이해가 되지 않으신다면 밑의 예시를 적겠습니다.] 때문에 저는 '골인시 A+남은 코인의 비율xB가산, 코인을 획득할 시 남은 코인의 비율xC 가산.'형태의 보상 시스템을 생각하고 있습니다. A, B, C는 원하는 대로 조율하되 A는 골인 그 자체에 목적을, B는 최단 거리를 찾게 유도를, C는 골인 지점을 찾도록 유도를 하는(=맵을 돌아다니게 하는) 역할을 하므로 A와 B는 높고 C는 적당히 주어야 합니다. (예를 들면 A는 5, B는 10, C는 0.1인 보상 체계를 생각할 수 있습니다. [위에서 언급한 예시를 여기에 적어놓았습니다.] A.I가 코인을 통해 얻는 이익이 0.1, 코인을 먹음으로써 골인시 얻는 점수량의 감점이 0.05라면 0.05점 보단 0.1점이 좋으니 최대한 코인을 많이 먹기 위해 움직일 것입니다. 네, 최장거리로 이동합니다. 반대로 A.I가 코인을 통해 얻는 이익이 0.1, 코인을 먹음으로써 골인시 얻는 점수량이 감점이 0.5라면 0.5점이 0.1점보다 훨씬 좋으니 A.I는 최단 경로로 골인을 하려 할것입니다. 이상 저번 영상에도 의견을 남겨본 중2의 의견이었습니다. 지극히 뇌피셜과 사고실험으로 얻어낸 결론이므로 문제가 발생할 수 있습니다. 중복되는 내용 혹은 이해가 되지 않는 내용이 좀 있을 수 있는데 이는 화자가 대충 생각나는데로 끄적이고 있기 때문이므로 양해 바랍니다. 이상 긴글 읽어주신 것에 감사를 표하며 좋은 하루를 보내길 바라겠습니다. 이상 글을 마칩니다.
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
오! 이번에도 좋은 의견 남겨주셔서 감사합니다!! 참고해보겠습니다!
@함동규-u8b
@함동규-u8b 2 ай бұрын
@@MuJiRaengI :) 저의 의견이 도움이 되어서 좋네요, 프로젝트의 진행이 더욱 잘 풀리기를 바라겠습니다.,
@숲속의_담
@숲속의_담 2 ай бұрын
이분은 왜 안뜨는걸까
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
감사합니다!!! 지금도 갑자기 구독자분들이 생각보다 많아져서 심장이 두근거리는걸요 ㅜㅜ
@유명한
@유명한 2 ай бұрын
@@MuJiRaengI 시청자수랑 구독자 상승 하는 수치 봤을 땐 이대로 열심히 하시면 1만까진 충분히 금방 갈 수 있을 거라 생각해요.
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
​@@유명한 헉... 지금은 까마득해보이지만, 열심히 해보겠습니다!!!
@inis-chan
@inis-chan 2 ай бұрын
곧 고정될 댓글이네요
@슬배-s6l
@슬배-s6l 2 ай бұрын
난 떳어욧
@normal1play
@normal1play 2 ай бұрын
코인 하나당 +1, 도착시 코인 +15(위험지대에 1초 있을 때마다 +1) 플레이 시 1초마다 -3 위험지대에서는 1초마다 -1 왔던 곳 되돌아가면 -0.3 사망 시 -5 1: 1초마다 점수가 깎이면 조금더 빨리 도착하려 할 수도 있다. 예시처럼 1초에 코인을 3개 먹어야 점수가 본진인 경우는 계속 초당 3개를 먹을 수 없기 때문에 빨리 도착하는게 이득이라고 생각하게 할 수 있다. 2: 위험지대에서 깎이는 양이 잘반으로 줄지만, 그래도 감점이 되기 따문에 빨리 벗어나려 할 가능성이 있다. 위험지대 너머에 클리어 지점이 있기 때문에 위험지대를 탈출하면 보상이 주어지는 것과 같다. 예시를 잘 보면 깎이는 수치만큼 클리어 보상을 추가해준다. 이걸 이용해서 위험지대를 넘어가기만 하면 본진임을 각인시켜줄 수 있다. 3: 이동 시간에 비례해서 깎이는 코인이 더 많아지게 하면 더 짧은 거리를 찾으려 한다. 특히 맵에 있는 코인은 한정되어 있기에 코인을 다 먹고 도착하려 해도 단거리로 가는 것이 점수가 더 높은 수치를 찾으면 수월하게 단거리를 찾아낼 수 있(길 바란)다. 4: 지금까지 대략적인 추측이었다. 아직 못 배운 프로그래밍 언어라 정확하게는 모르겠다.
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
좋은의견 감사합니다! 위험지대에 깎이는 양이 반으로 줄어드는건 매우 좋은 생각인 것 같아요!
@졸지마
@졸지마 2 ай бұрын
영상 보면서 같이 퍼즐 해결하는 느낌도 들고 주제가 이해하기 간단해서 재밌네요
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
갑사합니다! 최대한 쉽게 설명하는 걸 목표로 하고 있는데 이해가 쉽다고 하시니 다행이네요!
@Tanat0206
@Tanat0206 2 ай бұрын
문제가 발생하는 원인인 움직임의 대한 패넕티와 보상을 그냥 없애버리는 것도 하나의 방법이라고 생각합니다.
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
오! 새로운 관점이네요 좋은 의견 인 것 같습니다!
@쩡-e5b
@쩡-e5b 2 ай бұрын
진짜 볼때마다 대단하신거같아요 너무 재밌게봐요 다음꺼 올라오는거 기대중 ㅎㅎ
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
응원해주셔서 너무 감사합니다 ㅜㅜㅜ 실망시켜드리지 않게 열심히 하겠습니다! 감사합니다
@meroby
@meroby 2 ай бұрын
견문색 패기를 습득한 ai ㅋㅋㅋ 세상에서 제일 어려운게임을 깨는 ai라.. 되게 흥미로운 탐구주제인것 같고 만약 포트폴리오로 적으면 이목을 끌것 같은 내용이네요!! 크으으 응원해요
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
좋게 봐주셔서 감사합니다!!
@네모네모-l3s
@네모네모-l3s 2 ай бұрын
시간이 경과할수록 점수 감점 코인을 먹을수록 감점 장애물에 닿을경우 크게 감점 완주시 점수보상 , 마이너스점수는 실패 되돌아가는건, 코인은 먹어도 2초뒤에 재생성한다는걸로 방지할수 있을거같아요 완주점수가 100점 코인당 -1점 , 초당 -0.5점 이런식으로 조절해서 최대한 많은 점수를 받게 하기, 경쟁이라는 개념을 쓸수 있다면 더 좋을거 같습니다 맵에따라 완주점수만 조정하면 간단하게 수정도 가능할거같고요
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
오! 좋은 의견 감사합니다!
@ΡΙΚΑ_ΡΙΚΑ
@ΡΙΚΑ_ΡΙΚΑ 2 ай бұрын
구독 박고 갑니다
@MuJiRaengI
@MuJiRaengI Ай бұрын
헉! 감사합니다!!! 열심히 하겠습니다!
@kimdog0418
@kimdog0418 2 ай бұрын
영상 재밌어요
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
재밌게 봐주셔서 감사합니다!
@aiphdssong
@aiphdssong 2 ай бұрын
개인적으로는 코인 먹는 최단 경로 먼저 찾아서 박아놓고 그 경로에서 떨어질 때의 loss + 사망띠 loss + 클리어 loss 를 weighted sum 하는 것이 생각나는데, 이미 다 해보셨겠져 이정도까지 도달했다는 건? Ai한테 쌩으로 다 시키지 않고 인간의 지식이 좀 들어가서 인간이 납득하는 판단을 하는 ai를 만드는게 목표이신거 같아서 몬가 같이 방탈출 하는 느낌 들고 재밌네요 ㅋㅋ
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
재밌게 봐주셔서 감사합니다! 좋은 의견 공유 해주셔서 감사합니다!
@enxsis
@enxsis 2 ай бұрын
알고리즘 타고 들어왔습니다. 게임을 해본 기억과 영상 내용을 바탕으로 제 개인적인 포인트를 적어봅니다. 0. 클리어. 목표는 "최적화된" 플레이를 ai가 학습하는 것이므로, 역팩맨 방식의 코인 누적량 계산은 적절한 학습수단이 아니라고 생각합니다. 파란 공 다 피하며 맵 전체를 한붓그리기 하는 것은 파고들기 요소일 뿐이니까요. 어떻게 움직이든 일단 클리어를 해야 하고, 그 시간을 최소화 시키면 자연스럽게 불필요한 움직임이 줄어들을 것입니다. 클리어에 투명코인 먹는 행위가 중요할까요? 아니죠. 최대한 적게 움직여서 "깬다" 고 목표한다면, 움직일 때 마다 마이너스. 클리어시 점수를 max, 이동거리만큼 낮아지게 설정. 역팩맨 방식으로 움직이면 (=빙빙 돌아서 가면) 점수가 낮아지겠죠? 아마도 ai가 "뭘 해도 점수가 낮아지네?" 싶어서 안 움직이려고 할 겁니다. ☆ 데스를 기록한다면, 이동거리와 상관없이 같은 점수를 부여 목표는 클리어 위험지대 이동시간(가산요소) 및 제자리 왕복, 안전지대 정지시간 (감점요소) 등을 기준으로 '얼마나 더 멀리 탐험을 나갔는가' 를 피드백하면 될 것 같습니다. 이 경우, 얼마나 시간을 오래 잡아먹어도 클리어를 언젠가 할 것이고, 그 뒤로는 데이터를 바탕으로 클리어, 시간단축 피드백을 하면 될 것입니다. /* 시간단축 피드백 파랑 공 예측 ai처럼, 남은거리/이동속도 를 통해서 '진행도를 계산' 할 수 있는 ai도 만들어 사용할 수 있지 않을까 싶습니다. */ 1. 노란경계(안전지대와 위험지대) 최소 움직임을 목표로 하기에, 안전지대에서는 움직일수록 손해이고, 보상도 없어야 합니다. 역팩맨의 기존 단점은 안전지대에서의 이동이 보상을 가졌다는 것입니다. 위험지대를 지나지 않으면 클리어가 불가능하죠. 맵별로 안전지대가 여러 곳이 있고, 그 우선순위도 정할 수 있을 겁니다. 안전지대에서는 노란색 부분으로 이동을, 그 이후에는 시간을 재며 다음 경계까지 이동을 목표로 학습하면 될 것 같습니다. 인게임에서 변수가 없는 행위이기 때문에 최적화가 어렵지는 않을 것 같네요. 똑같은 개념으로, 위험지대 내부의 코인은 경계 표시만 해놓아 우선순위로 잡고, 다음 이동을 바로 최적화 학습 하지 않을까 예측해봅니다. 2. 정지행위 파란공 예측 AI를 사용해서, 특정 위치에서 '지금' '이동하면' '데스' 라는 개념을 ai에게 주입할 수 있을까요. 인간은 ' 아 파랑공 궤적 보인다' > '지금 가면 죽는 속도네' > '그러면 바로 뒤에 붙으면 안죽겠지' 라는 사고 흐름을 가집니다. 비슷한 방식으로 '목표 방향으로 이동, 이동 중 파랑과 충돌 직전에 방향전환 또는 대기' 의 우선순위를 부여할 수 있습니다. 이 기다림은 '클리어에 반드시 필요한 움직임' 이기 때문에 안전지대 정지시간과 밀접한 관련이 있습니다. 3. 방향키 동시 입력 이 게임은 좌/우와 상/하의 동시입력을 받기 때문에, 대각선 방향으로 이동할 수 있습니다. 목표와의 좌표 관계가 직선이 아니라면, 대각선으로 움직이는 것이 이동거리가 늘기 때문에 클리어타임이 줄어들겠죠. 반대로, 피드백 과정에서 이동거리를 따진다면. 직선길을 대각선으로 움직이게 될까요? 동시입력 처리가 궁금합니다. 이 영상과 이전 영상만 봐서 제가 놓친 부분이 있을 수 있습니다. X. 알고리즘 '클리어' 와 '최적화' 는 다른 문제입니다. 역팩맨 방식은 확실한 클리어를 보장합니다. 브루트 포스랑 다르지 않기 때문입니다. 모든 길을 걷도록 유도하는데 안죽으면 깨겠지. 때문에 클리어 알고리즘은 ★'다른 모든 요소를 제거' 하고 성공, 실패, 성공 유도요인들만 피드백을 하게 됩니다. 이 때문에 실질적인 클리어에 '유의미한' (위험지대 이동거리, 먹은 노랑코인의 개수, 전체 클리어 진행도) 지표들로 피드백을 해야 하죠. 최적화는, 클리어를 전제로 합니다. 때문에, 클리어 알고리즘과는 다른 피드백을 필요로 합니다. 시간 비례 진행도, 누적 정지시간, "클리어 최소 이동거리 계산"(= 이동 최소시간 계산), 체크포인트 랩타임... 클리어를 전제로 하기 때문에, 똑같은 클리어 결과를 놓고 1) 더 적은 시간, 2) 더 적은 이동의 우선순위로 목표를 잡으니까요. 매우 흥미로운 주제로 지속적으로 영상 올리신다니 구독 누르고 갑니다. 이상 00대학교 컴퓨터공학과 학생이였습니다.
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
역시 컴공과 학생이신분은 다르네요.. 제가 100%이해는 하지 못했지만, 좋은 참고할 수 있는 댓글을 달아주셔서 감사합니다!
@열심히-l2o
@열심히-l2o 2 ай бұрын
Ai를 잘 모르지만, 코인 먹는걸 우선 배제하고 클리어존에 도달하는 시간에 비례해서 점수부여가 가능하게 하는걸 학습시키면 최대한 빠르게 클리어존에 들어가려고 할거같아요.
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
맞아요! 저두 그렇게 해보고 싶은데.. 그런데 클리어 자체를 못 하면 클리어 점수를 받을 수 없어서 우선은 클리어를 할 수 라도 있게 학습시키는 방법(역팩맨)을 연구하고 있습니다!
@열심히-l2o
@열심히-l2o 2 ай бұрын
@@MuJiRaengI 아 클리어부터 하게 해야하군요, 한 번 같이 생각해봐요!
@초코찬양교주님
@초코찬양교주님 2 ай бұрын
모델은 어디에 리워드가 있다 보다는 무슨행동을 했더니 리워드를 받더라 라고 생각하면 이해하기 쉬울것같아요 최적의 경로는 한번만 찾고 경로따라서 가상의 리워드를 나열해두면 리워드를 받으려한 행동이 가장빠른 경로가 될것같아요
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
좋은 의견 감사합니다!! 그런데 최적의 경로를 찾는 게 어렵더라고요 ㅜㅜ
@simu14
@simu14 2 ай бұрын
인공지능쪽으로는 어깨너머로 본것들 뿐이라 잘 알지는 못하지만사소하게나마 아이디어라도 풀고 갈게요 맵 전체에 가상의 코인을 두고 먹은 코인이 적을수록 클리어에 큰 보상을 주는건 나쁘지 않은것 같아요. 대신 아무리 돌더라도 클리어하는게 더 이득이 되도록 클리어 보상을 1+(남은 코인)×2 로 주면 어떨까 싶네요. 이러면 남은 코인이 많을수록, 즉 들르지 않은 칸이 많을수록 높은 보상을 받게 될테니까요. + 이미 지나간 길에 대한 보상을 패널티로 바꾸는건 길게 봤을때 좋지 않을것같아요. 이미 지나간 길을 두어번 더 지나가야 하는 레벨이 있는걸로 기억하고 있거든요.
@simu14
@simu14 2 ай бұрын
아마 예상하건대 처음으로 클리어하고 한동안은 탐험을 우선으로 하다가, 더 적게 탐험할수록 보상이 커진다는걸 알고 난 뒤부터 경로를 최적화하려 하지 않을까 싶네요
@simu14
@simu14 2 ай бұрын
+ 게임 클리어에 있어 최적화라는게 최단 거리로 할지 최단 시간으로 할지도 중요할것같아요. 최단 시간이 기준이라면 매 초 작은 패널티를 부여하는것도 좋을것같아요
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
좋은 의견 감사합니다! 저도 지금 고민인게 이미 지나간 길을 다시 지나가는 부분이 있었던 것 같은데, 이 경우엔 어떻게 해야 할 지 저도 고민입니다 ㅜㅜ
@showoff_my_picture
@showoff_my_picture 2 ай бұрын
ㄹㅇ 유튜브 알고리즘 납치해서 이분 띄우고싶다
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
헐 ㅜㅜ 감사합니다 ㅜㅜㅜ
@36악장
@36악장 2 ай бұрын
먼저 클리어 할 수 있도록 하는 보상을 먼저 주고, 클리어를 할 수 있으면 정책망을 fine-tuning하는게 나을수도? 최적의 정책을 학습할 수 있는 보상을 잘 설계할 수 있으면 좋겠지만 결국 보상에 대한 가치함수를 잘 모르는 상황에서 바로 배우기는 쉽지 않을듯.. 클리어 보상을 먼저 설계해서 적당한 정책망 학습하고, 가치망을 백본으로 두든, 보상을 adaptive 하게 업데이트를 하든 이런 방식으로 학습하는게 더 나아보이네요
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
오! 좋은 의견 감사합니다! 한번 고민해보겠습니다!
@bbiano757
@bbiano757 2 ай бұрын
가상의 코인을 많이먹을수록 점수가 적어지면 되지 않을까요? 클리어 1점으로하고 가상의 코인을 많이 먹을수록 점수의 분모부분에 더해지는거죠. 3개먹으면 1/3점 6개먹으면 1/6점 이러면 인공지능이 최대 점수를 얻기위해 분모를 최소로 하려고 움직일 것 같아요. 클리어점수를 1점으로만 해놔도 가상의 코인을 먹었을때 얻을 수 있는 점수로는 절때 넘을 수 없는 점수이기에 인공지능 입장에서 무조건 클리어를 향해 갈 것 같습니다. 그리고 파란 공 같은 경우엔 단순하게 분모 부분에 x2 정도 하는 방식으로 페널티를 줘도 될 것 같아여
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
오! 좋은 의견 감사합니다!
@hahasilsil
@hahasilsil 2 ай бұрын
0:06 들렸다가X 들렀다가O
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
헉... 죄송합니다 ㅜㅜ 다음부터 좀 더 신경 쓰겠습니다
@diyaha1038
@diyaha1038 2 ай бұрын
시작지점에서 도착지점까지의 최단 거리 + 도중 코인 먹는 것. 으로 장애물만 빼고 생각하면 다이나믹 프로그래밍 기법을 이용한 그리드 알고리즘이 도움이 되실건데.. 장애물을 어떻게 변수로써 처리할지를 모르겠네요..
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
오! 좋은 의견 주셔서 감사합니다!
@허언증완치자
@허언증완치자 2 ай бұрын
사막에서, 1m 떨어진 물 한모금 vs 500m 떨어진 물한잔. 눈앞의 웅덩이 vs 백두산 천지 웅덩이
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
엇 ㅋㅋㅋㅋㅋ 아주 적절한 비유네요 ㅋㅋㅋ
@CyanColorStar
@CyanColorStar 2 ай бұрын
그냥 반대로 적용시키면 되는거 아닌가.. 가장 적은점수->가장 높은 점수로 맵 전체 코인의 점수에서 클리어 한 후 먹은 코인의 점수를 빼주는 형식으로..?
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
오! 맞아요! 지금 비슷하게 진행하고 있습니다!!!
@슬배-s6l
@슬배-s6l 2 ай бұрын
구독 좋아요 알림설정까지 알차게 하고 옴
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
헉.. 너무 감사합니다 ㅜㅜㅜ 열심히 하겠습니다!!
@크리kri
@크리kri 2 ай бұрын
클리어 보상 +1 클리어한 경우에 더해 시간 보상 짧을 수록 많이 (최대 0.5점) 공에 맞아 죽은 경우 -0.2점 죽었거나 시간 초과된 경우 A* 알고리즘(혹은 다른 길찾기 알고리즘) 기준으로 골인지점까지 거리 짧을 수록 많이 (최대 1점) 이런식으로 짜보면 어떨까요...?
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
오! 죽은 후에 거리를 측정해서 점수를 주는 방식은 생각지도 못했네요. 한번 고민해보도록 하겠습니다!
@nanotree
@nanotree 2 ай бұрын
위험지역에서 최대한 오래 살아남는 ai를 만든 다음 최단 거리 이동을 강제하고 특정 상황에서만 우선권을 부여하는 방식으로 죽는것만 피하게 다소 인위적이긴 하지만 일단 완성은 되지 않을까요
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
오... 매우 좋은 아이디어 같습니다!!! 어쩌면 다음 영상에서 해당 내용이 나올지도 모르겠어요!!
@저녘놀
@저녘놀 2 ай бұрын
좀 여유가 되서 각잡고 할 수 있으면 인공지능 설계하고 학습시키는 방법 배워보고 싶네요. 이렇게 방법 자체만 말로 풀어서 설명해주시면 이해는 가는데 실제로 설계하는 과정은 그렇지 않을테니..
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
맞아요... 사실 머리속에서는 AI로 이미 클리어를 다 했는데 실상은 이제 1, 2탄 클리어도 힘들어서 ㅜㅜ
@거참귀찮-j2t
@거참귀찮-j2t 2 ай бұрын
1. 코인을 이용하지 않고 이동거리만을 계산할 순 없는건가요? 2. 아니면 클리어 타임을 잰다던가 3. 흰색 코인을 흭득하면 -점수를 흭득하는 방법은 불가능할까요?
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
불가능한건 없습니다! 좋은 의견인 것 같아요! 클리어 타임 같은 걸 재고 싶은데, 사실 클리어를 못하면 클리어 타임이 무한대라서 요즘은 클리어를 어떻게 해야 할 수 있을까를 고민중입니다 ㅜㅜ
@거참귀찮-j2t
@거참귀찮-j2t 2 ай бұрын
@@MuJiRaengI 그럼 3번 방법을 이용해서 클리어시 점수를 주는 방법이 무난해 보이네요
@종민박-s5i
@종민박-s5i 2 ай бұрын
수학적으로 최소거리는 실을 두 점에 두거 팽팽하게 땡겼을때입니다.두점에 줄을 긋고 벽이 있으면 돌아가야됩니다.
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
맞아요!! 그래서 두 점 사이의 거리를 실시간으로 측정하기가 힘들더라고요 ㅜㅜ
@종민박-s5i
@종민박-s5i 2 ай бұрын
목적지로부터의 거리로부터 모든 필드까지의 거리를 미리 구해둔다면 계속해서 구할필요는 없습니다
@Tanat0206
@Tanat0206 2 ай бұрын
​@@종민박-s5i이미 정답이 있다는 것은 AI를 이용하는 의미가 없어집니다. 맵이 랜덤으로 나온다해도 예측을 통해 풀어나가는 것이 AI이죠
@오렌지좋아-z4d
@오렌지좋아-z4d 2 ай бұрын
제한시간과 클리어 시간에 따른 보상은 어떤가요?
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
좋은 생각인 것 같아요! 지금 어떻게하면 클리어 사긴이나 움직인 거리에 따른 보상을 줄까 고민중입니다!
@tow-zero
@tow-zero 2 ай бұрын
일단 코인을 먹는 것 보다 클리어 보상이 너무 낮습니다. 클리어 보상이 높으면 위험 지역으로 잘 가지 않는 문제가 해결될 수 있습니다. 그리고, 클리어 이후 시간에 따라 감점해보는 건 어떤가요? 시간이 지남에 따라 기하급수적으로 감점이 증가하게요. 예를 들면 1초가 걸리면 0.1점을 감점하고, 2초가 걸리면 0.2점을 더 감점하는 식으로요. 그러면 케릭터가 온 맵을 훑는 것을 방지 할 수있습니다. 요약 - 클리어 보상을 (매우) 많이 높이고 시간에 따른 감점을 추가해 보세요. 지금 원하는 것은 "클리어를 최대한 빠르게 하는 AI"이기 때문에 당연히 시간 감점 요소와 클리어 보상 요소가 중요시 되어야 합니다. 역 팩맨 알고리즘 같은 건 "AI가 여러 가지 시도를 할 수 있게 유도하는 서브 알고리즘" 정도로 생각해야 합니다.
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
오! 소요된 시간을 보상에서 감점할 때 선형적으로 감점하지 말고 지수함수처럼 감점하는 건 좋은 아이디어인것같습니다!
@금갈치
@금갈치 2 ай бұрын
클리어 시간 보너스 혹은 기본점수 10점 + 먹는 가상의 코인마다 -0.1점 감점 이런식은 어떨까요? 알고리즘 잘 모르는 무지렁이의 생각이었습니다
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
오! 지금 매우 비슷하게 진행하고 있습니다!! 알고리즘을 잘 모르는데 이런 생각을 하시는 건 대단하신 것 같아요!
@WatchMe-rc6pv
@WatchMe-rc6pv 2 ай бұрын
반대로 점수를 뺏는것은 어떨까요 처음시작지점에 20점을주고 가만히있으면 1초에 0.1씩 추가되는 감점을 넣어서 1초동안 움직임이 적게있으면 -0.1,(-0.1) 2초에 -0.2,(-0.3), 3초에 -0.3(-0.6) 등 감소되게하고 되돌아갈시 똑같이 마이너스 도착지점에는 +5점을 추가로주면서 흰색코인을 먹으면 먹을수록 점점 점수를 적게주다가 추가적으로 경과한 시간에따른 마이너스 배율을넣어서 결국 일정시간 이후부터는 코인을 먹어도 점수가깎이는 마이너스배율로 바뀌게하는거죠 응용해서 안전지대는 5초안에 벗어나지않으면 점수마이너스 위험지역은 30초 이런식으로 설정하면 좋지않을까요
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
오! 새로운 관점이네요!! 점수를 뻇는거 한번 고민해보겠습니다!
@Tanat0206
@Tanat0206 2 ай бұрын
게임을 하다보면 파란공을 피하기 위해 무조건 기다려야 하는 스테이지가 있는데 움직임의 대한 패널티가 이런 부분에선 오히려 역효과가 나타날 수 있을 것 같네요
@Cl_Han_
@Cl_Han_ 2 ай бұрын
걍 처음 시작할 때부터 일정량의 높은 점수를 주고 거쳐간 가상 코인의 수만큼 점수를 차감하면 되는거 아닌가...?
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
맞습니다!! 지금 말씀하신 것과 매우 비슷하게 하고 있습니닷!
@OO-pc3po
@OO-pc3po 2 ай бұрын
파란 공 예측 알고리즘은 어떤 모델을 사용하셨나요??
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
일단은 Unet사용했습니다. 필요하다면 SOTA모델로 업그레이드를 할 생각도 있긴 합니다만, 지금도 잘 돼서 할지는 잘 모르겠습니다!(나중에 성능 부족해지면 할 것 같아요!!)
@Just_6232
@Just_6232 2 ай бұрын
모든 코인을 먹어라. + 최대한 빠르게 완주 해라. 입력을 시키면 어떨까요 완주시에 지나지 않았던 모든 흰색구역 보상을 얻게끔 설정하고.
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
맞아요! 말씀하신 것 처럼 입력을 시켜주고 있는데, 제가 제대로 구현을 하지 못한 건지 아니면 뭔가 제가 실수를 한 건진 모르겠는데 생각보다 잘 안되더라고요 ㅜㅜ
@Operationbt
@Operationbt 2 ай бұрын
테크유튜버 잇섭님 목소리를 닮았어요
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
오! 그런가요?? 신기하네요!! 잇섭님 팬인데 감사합니다!!
@gorkengos
@gorkengos 2 ай бұрын
클리어 지역에 들어갔을 때의 점수를 압도적으로 올리면 어떻게 되나요? 당연히 생각은 해보셧을 것 같기는 한데
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
좋은 말씀 감사합니다! 아직 해보진 않았고 지금 해보는 중인데 문제는 클리어를 못해서 점수를 줄 수가없네요 ㅜㅜ 클리어 점수를 높게 주고 싶은데 AI가 클리어를 하질 못해서 점수를 못주고 있어요 ㅠㅠ
@ez-dz6bi
@ez-dz6bi 2 ай бұрын
중2면 2008년에 나온 세가게보다 나이가 적네 ㄷㄷ
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
헐! 지금 생각해보니 그러네요 ㄷㄷㄷ
@고기1
@고기1 2 ай бұрын
이젠 AI가 견문색까지 쓰네
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
좀 더 발전된 견문색을 쓸 수 있도록 노력해보겠습니다!
@syk6329
@syk6329 2 ай бұрын
진짜 몰라서 그러는데 걍 클리어점수를 개높게하고 코인 먹는 걸 -0.1 이전 칸으로 다시 이동하면 -0.5 이런 식으로 해두는 건 안 되나요
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
오! 지금 거의 비슷하게 실험을 진행하고 있습니다! 말씀하신 것 처럼 이전 칸으로 다시 이동하면 -0.5점과 같이 큰 점수를 빼버리면 그나마 좀 잘 하더라고요. 근데 문제는 게임 난이도가 조금 있어서 그런지 클리어를 해야 클리어 점수를 주는데, AI가 클리어를 못해서 큰 클리어 점수를 주고 싶은데도 못주고 있어요 ㅜㅜ
@성이름-c2q2f
@성이름-c2q2f 2 ай бұрын
시간이 늘어날수록 점수를 차감시키면 최단시간=최단루트 클리어 가능?
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
제 생각에도 가능할 것 같긴 한데 해봐야 알 것 같습니다 ㅜㅜ
@Kata_Shus
@Kata_Shus 2 ай бұрын
시간에 비례 해서 점수주면 될것 같은데요? ex) 5초 50점, 1분 이상 1점
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
좋은 의견 감사합니다!! 말씀해주신 것 처럼 빠르게 클리어 하면 높은 점수, 느리게 클리어 하면 낮은 점수를 주는게 좋은 것 같아요!!
@혜수-e8o
@혜수-e8o 2 ай бұрын
나는 코딩을 못하지만 이게 이렇게 어려운 건가 일단 블럭 단위로 생각하면 편할거같음 그리고 경로만들고 모든 경로에서 꼭 가야하는 블럭 구하고 그 블럭들 순서 만들고 블럭과의 거리로 점수주고 블럭 도착 점수주고 도착 점수주면 되는거아님? 공도 픽셀단위로 이해하면 예상 알고리즘도 더 오차도 적고 괜찮지않을까요? 아무튼 제 말은 ai가 임의의 도착지점을 지정할수있게 만들수있지않을까 싶습니다.
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
오! 좋은 의견인것같아요!! 새로운 아이디어네요! 감사합니다!!
@minecraft.youtube
@minecraft.youtube 2 ай бұрын
클리어 점수를 10점으로 하면 빠른 경로로 가지않을까요?
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
오! 좋은 의견 감사합니다!!! 현재는 말씀주신 것 처럼 클리어 점수를 높여서 진행해보고 있습니다!
@tkaans
@tkaans 2 ай бұрын
그리드를 색으로 지정해서 하는 아이디어는 어떤지...(색으로 구분해서 a*알고리즘으로 경로 생성까지는 직접해봤는데 컴터가 안좋아서..)
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
그리드를 색으로 지정한다는게 어떤 말씀인지 잘 모르겠어요 ㅜㅜ 조금만 더 자세하게 알려주실 수 있으신가요..?
@tkaans
@tkaans 2 ай бұрын
@@MuJiRaengI 앗.. 저도 아직 공부하는 입장이라서 잘 모르는데, 게임 맵 구역과 시작/끝 지점, 캐릭터, 장애물을 색별로 구역을 나눠주고, 목적지는 처음 탐색시 멀리있는 안전 구역을 목적지로,맵 전체를 좌표 이동 방식으로 이동하도록 해서 A*알고리즘이랑 BFS알고리즘으로 최단 경로를 구하도록하고 장애물 현재 위치와 예상 위치를 이동 불가 좌표로 정해서 경로를 만들도록 만들었는데..(제 컴이 구린건지 죄표를 너무 세세하게 나눈건지는 모르겠지만 경로 한번 만드는데 좀 걸리더라구요.)[그래서인제 저는 프로그램이 맵 화면이 안전 구역과 이동 구역, 경로를 직접 구하더라구요.]
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
@@tkaans 저도 최단경로 구하는 방법으로 해봤는데(A*사용) 시간이 엄청 느리더라고요. 그래서 어떤 분이 알려주신 알고리즘이 JPS(b) 이 알고리즘 한번 찾아보시면 도움이 될 수 있을 것 같아요!
@user-rz9yx5ee7e
@user-rz9yx5ee7e 2 ай бұрын
이렇게 ai를 다루려면 뭘 공부해야하나요?
@danny04278
@danny04278 2 ай бұрын
선형대수,확률과통계,자료구조,알고리즘,파이썬,머신러닝,딥러닝,강화학습,대학원
@gagtwe
@gagtwe 2 ай бұрын
@@danny04278마지막에 이상한 거 있는데요
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
만약 대학교 가기 전이라고 하시면 수학 영어 열심히 하시다 대학교가면 댓글달아주신 @danny04278님 말씀처럼 공부하시면 될것같아요!
@엑조디아
@엑조디아 2 ай бұрын
남은코인/클리어시간 점수만 주면 꽤 좋을지도 모르겠어요
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
감사합니다!! 남은코인이나 클리어시간을 점수로 주는 방법을 계속 적용해보려고 하고 있습니다!!(근데 쉽진 않네요 ㅜㅜ)
@로딩중.....임
@로딩중.....임 2 ай бұрын
처음지역에선 0점 위험지역에선 0.5점 (파란공-1.0) 그다음 길목 0.7점 클리어 1.0 하면 그으래도 조금은 가지 않을까요?
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
맞아요! 그런데 제가 지금 하고싶은건 1탄이나 2탄이나 동일하게 점수를 주는 걸 하고 싶은데, 이렇게 하면 매번 제가 탄마다 점수를 줘야하더라고요 ㅜ
@로딩중.....임
@로딩중.....임 2 ай бұрын
​@@MuJiRaengI아이고 ai때문에 고생많이 하셔요 ㅠㅠ
@지나가는사람-f4z
@지나가는사람-f4z 2 ай бұрын
클리어를 하면 점수를 더 높게줄수는 없을까요? 그러면 위험지역을 지나서라도 클리어를 하러갈것 같은데... 거기다가 시간이 늦어지면 점수를 천천히깍거나 도착했을때 점수를 시간의 비례해서 주면 될것같기도 하네요
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
맞아요! 저도 클리어 점수를 1.0이 아니고 더 높은 점수를 줘야 하나 고민중입니다 ㅜㅜ 일단 대부분은 점수를 -1 ~ 1 사이로 주고 있길래 따라해보고 있는건데, 잘 안되면 저도 1.0말고 10.0정도 처럼 훨씬 더 큰 점수를 줘볼까 고민중입니다!
@조준우-d8g
@조준우-d8g 2 ай бұрын
견문색 패기 💀💀💀
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
패기를 더 업그레이드 시켜주고 있는데 제 실력이 부족하네요 ㅜㅜ
@kipyaka
@kipyaka 2 ай бұрын
내가 뭘 본거지??
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
헉.... 어떤 걸 보신거죠...??? 궁금하신게 있으시면 알려드리겠습니다!!
@김서우임
@김서우임 2 ай бұрын
난 처음볼때 캐릭터가 코인 먹으면 -1점 되는줄 알았았는데 아니넹?ㅋㅋㅋㅋㅋ
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
넵! 지금은 캐릭터가 죽었을 때에만 -1점을 주고있습니다!
@corywhite822
@corywhite822 2 ай бұрын
최단시간에 가장높은 점수를 주는건 안될까요
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
맞아요! 저도 최단시간에 가장 높은 점수를 주고 싶은데, 그걸 구현하기가 힘들더라고요 ㅜㅜ(저의 실력부족 이슈로....)
@LOOPARAM-le6yv
@LOOPARAM-le6yv 2 ай бұрын
코드 공유 가능하실까요?
@MuJiRaengI
@MuJiRaengI 2 ай бұрын
죄송합니다 현재 코드 공유는 힘들 것 같습니다 ㅜㅜ
@SIKANO-sika
@SIKANO-sika Ай бұрын
님도 영상 만드는 학습ai???
@MuJiRaengI
@MuJiRaengI Ай бұрын
아뇨 영상은 아니고 게임하는 AI입니다!
[1탄 클리어] AI가 게으름을 피운다고!?! #게임AI
14:30
무지랭이
Рет қаралды 3,9 М.
Osman Kalyoncu Sonu Üzücü Saddest Videos Dream Engine 262 #shorts
00:20
DID A VAMPIRE BECOME A DOG FOR A HUMAN? 😳😳😳
00:56
didn't manage to catch the ball #tiktok
00:19
Анастасия Тарасова
Рет қаралды 33 МЛН
훔치기만해서 200만 골드를 벌 수 있을까?
7:49
김나큐
Рет қаралды 80 М.
*아무것도 누르면 안되는 게임*
18:55
우주하마
Рет қаралды 1,6 МЛН
쿠키런 모험의탑의 근황과 망해가는 이유
18:48
지존조세
Рет қаралды 83 М.
IQ130 이상만 깬다는 애벌레로 조각하는 게임
21:15
우주하마
Рет қаралды 558 М.
Osman Kalyoncu Sonu Üzücü Saddest Videos Dream Engine 262 #shorts
00:20