목록맘야의 컴퓨터 이야기 (26)
맘야의 이런저런 이야기들
pandas와 mglearn 모듈을 import 하고 mglearn 모듈을 사용하려 할 때 오류가 발생한다. 위 사진은 구글 colab 환경인데, 문제 해결 이후에도 계속 오류가 난다. colab 에서의 오류는 아직도 해결을 못하였고, jupyter notebook 환경에서 결국에는 몇 시간 만에 성공을 했는데 의외로 간단한 오류였다. ( 줄여서 jn 이라고 하겠다. ) 바로 mglearn 모듈에서 버전이 맞지 않아서였다. jn 에서는 해결되어 문제없이 로딩이 되니 colab 에서 계속 오류가 난다면 jn 에서 실행해 보자. 우선, jn 환경에서 sklearn, joblib, mglearn 을 버전에 맞게 설치해 주자. 버전이 맞지 않을 경우 계속해서 오류가 나니 주의 바란다. 필자는 이것 때문에 몇 시..
카테고리 이름을 바꾸었다. 그냥 '코딩'으로 이름을 하고 일기이든 분석이든 적어보려 한다. 일기라고 해놓으면 하루하루 반드시 적어야 하는 부담이 느껴지는지라 시간 나는 대로 적고 싶은 내용을 추가하는 것으로 만족하자 ㅎ 오늘은 로지스틱 회귀모형을 배워봤는데, 역시나 기억은 잘 나지 않는다... 무리한 학습 진도가 낳은 폐해라고 얼버무리면서 자신을 탓해본다. 분석할 모형이 복잡하다. 이렇게 복잡한 모형은 선형분석으로는 한계가 있다. 왜냐면, 선형은 한 줄로 나열되어 있는 데이터를 분석하는데 용이한데 데이터가 이렇게 많거나 흩어져 있으면 선형분석으로는 분석하는 의가 없기 때문이다. 그래서 고안된 게 로지스틱 회귀모형이라고 한다. 점수는 높게 나와있다. 데이터를 보면 칼럼이 10개나 된다. 데이터가 얼마나 방..
sklearn 모듈에서 분석결과를 시각화한 것이다. 현재까지는 sklearn 모듈이 자주 언급되고 있다. 그만큼 많이 쓰이는 모듈인 것 같다. 위 그래프는 특성중요도를 나타낸 것으로 머신러닝을 할 데이터 특성이 차지하는 비중을 나타낸 것이다. 이렇게 나무 모양으로 시각화를 시켜볼 수 있다. 0, 1로 나타내지는 데이터 분류가 참, 거짓을 나타내면서 분류가 된다. 그런데, 가지가 너무 많으면 오히려 분석이 난해지 질 수 있어서 트리를 일정 수준까지 만으로 제한을 두는 경우가 많다고 한다. 3단계로 제한을 둔 상태이다. 이렇게 분석을 해야만 데이터가 난해해지지 않고 분석 정확도가 높아진다. 의사결정나무 앙상블에 대한 자료인데 좀 앙상블해 보이는가?? ㅎ 필자는 이게 뭔지 기억이 가물하다 -_-; 선형회귀 모..
파이썬 기초수업을 마쳤다. 빅데이터 관련 공부라서 시각화를 하는 것까지 해서 마무리되었다. 선택을 잘한 것 같다. 앞으로의 생활에 도움이 많이 될 것이라 생각한다. 투자에도 충분히 접목을 해볼 만하니 참 좋은 것 같다. 데이터를 입력받아서 Topic 별로 분류를 한 다음 시각화를 해본 것이다. 같은 단어라도 중요도가 다르게 나타난다. 자주 언급되는 단어보다 적은 횟수로 언급된 단어를 더 중요하게 분석하는 도구이다. 활용을 해볼 만한 가치가 있다. 파이썬을 마치고 머신러닝을 시작했다. KNN 분류인데, 꽃에 관한 데이터를 입력받아서 시각화를 한 것이다. 분포가 다양하게 나타나고 있다. 다른 모듈로 시각화를 해 본 것이다. 그룹이 더 세분화되고 색도 입혀졌다. 아직은 머신러닝 개념을 파악하기도 어려운 상태라..
요새 공부를 하고 있다. 그동안 해보고 싶었던 공부들이 몇 있었는데 시간적 여유가 생긴 요즘에 시작을 해보고 있다. 경제적 여유도 많았으면 좋으련만 꼭 부족하더라 ㅎㅎ 블로그 글을 잘 쓰다가 잠깐 뜸했더니 방문수가 크게 줄어 있다. 블로그를 다시 해볼 생각으로 월초부터 노력했는데, 학습 진도가 밀려서 일주일 정도는 신경을 못썼다. 블로깅은 현재 자신이 하고 있는 것을 쓰는 것이 좋다고 생각되어 코딩 공부하는 일지를 간략하게나마 적어보려 한다. 나름대로 지구를 구해봤던 '기후위기 극복하자'는 앞으로도 몇 편은 더 이어가야 하고, 1화에 멈춰있는 동화는 주제를 바꿔가며 앞으로도 꾸준히 쓸 계획이다. 시간적 여유가 생기자 할 일이 더 많아져버린 현실을 즐기며(?) 한 자 한 자 써 내려가 볼 참이다. 지금은 ..
마지막 수정 날짜 : 2018. 04. 16. 월. 유튜브 - https://www.youtube.com/watch?v=OIDRD_3oYH0&list=PL18_TeFgN9R1jo2A7pFnwy_zl9wE2yKDC&index=1 카카오TV - https://tv.kakao.com/channel/2687112/cliplink/384735333 1. 들어가며 리눅스는 저에게 있어서 매우 소중한 존재입니다. 왜냐하면, 리눅스가 있었기에 몇 년 동안의 어려운 과정을 보다 더 수월하게 헤쳐나갈 수 있었기 때문입니다. 리눅스의 모든 소프트웨어가 GNU 규정을 따르며 소스가 공개되어 있습니다. 이런 리눅스야말로 진정한 구원자라고 칭할 수 있겠습니다. 특히, 저처럼 어려운 과정을 겪고 있는 사람들에게 아주 훌륭한 도구를..
마지막 수정 날짜 : 2016. 01. 07. 목. 17:05. 들어가며 오늘 리눅스에 관하여 좋지 않은 소식을 접했습니다. (관련 기사 - http://news.kbs.co.kr/news/view.do?ncd=3209305) 우분투가 리눅스의 계열 중에서 '데비안'에 속하는데 바로 그것을 만든 사람(이안 머독, Ian Murdock, 1973년 4월 28일 ~ 2015년 12월 28일, https://ko.wikipedia.org/wiki/이안_머독)이 생을 달리했다는 소식입니다. 리눅스를 정말 잘 사용하고 있는 사람으로서 그분의 명복을 기리며 첫 번째 강의를 쓰겠습니다. 강의는 사용자가 쉽게 다가갈 수 있는 내용으로 채울 것입니다. 리눅스 설치는 어렵다? 천만의 말씀!예전에는 리눅스를 처음 접하는 사..
제 노트북 화면입니다. 조금 생소하죠? 바로 리눅스의 한 계열인 '우분투'를 운영체제로 사용하고 있기 때문입니다. 이것에 관하여 여러 가지 글을 적어볼까 합니다. 왜냐면 이 운영체제는 '무료'이고 사용자들이 모여 만들다 보니 편리한 기능이 이만저만 많은 것이 아니기 때문입니다. '보안'에서도 아주 뛰어난 운영체제입니다. 시중에 유통되고 있는 대부분의 '서버'는 바로 이 리눅스를 기반으로 하고 있습니다. 그만큼 사용자도 많을뿐더러 안정적이라는 뜻입니다. 저처럼 저렴한 컴퓨터를 사용할 때도 이 리눅스의 장점은 발휘됩니다. 매우 가볍기 때문입니다. '운영체제가 가볍다'는 것은 컴퓨터가 일할 때 적은 자원을 가지고 일 처리를 한다는 뜻입니다. 여러모로 장점이 많으나 잘 알려지지 않은 이 리눅스에 대하여 종종 글..
간만에 컴퓨터 이야기를 해볼까 합니다. 오늘은 PE 만들기입니다. WINDOW XP등을 USB와 같은 이동식 매체에 담아서 들고 다닐만한 크기로 작게 만든 OS를 통상적으로 PE 라 합니다. 제 PE 화면입니다. 일반적인 OS 와는 전혀 다른 모양입니다. PC 구동에 필요한 최소한의 자원만 사용 하게끔 만들어진 작은 OS 라서 그렇습니다. 이보다 훨씬 많은 기능을 가진 PE도 제작이 가능 하지만 용량이 많아지고 부팅 시간이 그 만큼 오래 걸립니다. 컴퓨터가 갑자기 부팅이 되지 않거나 블루 스크린이 생길 때 PE로 부팅을 하여 진단도 하고 수리도 할 수 있습니다. 제 PE에 들어있는 메뉴들을 보겠습니다. SHUT DOWN -> 컴퓨터를 끄거나 재부팅 할 수 있는 메뉴입니다. RUN... -> 시작-실행을 ..
강력한 이미지 툴 UltrISO 입니다. 버젼은 9.3.6.2750 이고 윤태원님에 의해 한글화되어 있습니다. 상용 프로그램 이므로 라이센스를 구입 하셔야 본래의 기능을 모두 사용 하실수 있습니다. 설치에 관해선 언급하지 않겠습니다. 설치가 완료 되면 옵션을 조정해 주시는것이 좋습니다...설정 메뉴의 환경 설정에 들어가 보겠습니다. 일반 탭에 휴지통 사용이 선택되어 있는데 권장 하지 않습니다...체크 해제. 저장 탭의 붉은 박스 옵션은 ISO 이미지를 만들때마다 원본을 *.bak 로 백업을 시키는 기능 입니다. 사용해본 결과 많이 불편 합니다...체크 해제. 기타 탭에 보시면 파일 연결이 있습니다. ISO 이미지 뿐만 아니라 거의 모든 이미지 파일을 열어볼수 있고 편집도 가능 합니다. 따로이 이미지 편집..