python에서 읽어온 CSV 데이터를 일정간격으로 무시하고 scatter 그리기 질문..

쓰기

python에서 읽어온 CSV 데이터를 일정간격으로 무시하고 scatter 그리기 질문..

python

2017-05

2017-05-25 20:15:43

조회 5553 추천 1

혹 python 다루시는 분이 계실것 같아 여쭤봅니다..

python에서 CSV 데이터를 읽어 온 뒤 scatter로 뿌리는 문제입니다.

CSV 데이터는 x_1, y_1, y_2로 되어 있고, 각 10,000개 씩의 값을 가진 20,000개의 좌표점입니다.

이를 대략 x축을 기준으로 1000간격에 해당하는 좌표점만 띄엄띄엄 scatter로 뿌리고 싶습니다.

이를 반복문을 써서

for step in range(10001):

if step % 1000 == 0:

x = x_1

y1 = y_1

y2 = y_2

x_1, y_1, y_2의 데이터를 1000간격씩 x, y1, y2에 새로 저장해

x,y1 그리고 x,y2를 scatter로 뿌리면 될꺼라 생각했는데, 생각이랑 다르게 안되네요.

어떻게 해야될까요..

아래는 제가 짜본 코드입니다.

import pandas as pd
import matplotlib.pyplot as plt

dataset=pd.read_csv("Basic.csv");
y_1= dataset.iloc[:,1].values.astype(float)
y_2= dataset.iloc[:,2].values.astype(float)
x_1= dataset.iloc[:,0].values.astype(float)


for step in range(10001):
    if step % 1000 == 0:
        y1 = y_1
        y2 = y_2
        x = x_1


plt.scatter(x, y1, marker='s', color='b')
plt.annotate('maximum: 0.3669', xy=(9991,0.3669), xytext=(6000,0.2), arrowprops=dict(arrowstyle="->", connectionstyle="arc3, rad=0.2"))

plt.scatter(x, y2, marker='^', color='r')
plt.annotate('maximum: 0.4869', xy=(9643,0.4869), xytext=(6000,0.65), arrowprops=dict(arrowstyle="->", connectionstyle="arc3, rad=-0.2"))


plt.ylim(0,1.0)

plt.legend(loc='upper left', frameon=False)

plt.show()

짧은글 일수록 신중하게.



변선주 2017-05 python은 잘 모릅니다만, 제가 사용하는 R에서 저라면 다음과 같은 방법으로 문제를 풀어보겠습니다. 순환구문에 의하여 점을 출력하는 방식으로 코드를 짜신 것 같습니다. 이럴 경우에 첫 번째나 그 근처 값을 가지는 다른 값은 plot에 보일 수 있으나 그렇지 않은 경우에는 첫 번째 plot 영역 밖의 값이라면 보이지 않습니다. 최대값과 최소값을 미리 확인하여 이 영역을 미리 plot에 정의하는 방법이 있습니다. 그보다 편한 방법으로는 그 몇 개의 값을 가지는 data 를 추출하여 별도의 data 를 만든 다음에 그냥 plot 해보겠습니다. python은 잘 모릅니다만, 제가 사용하는 R에서 저라면 다음과 같은 방법으로 문제를 풀어보겠습니다. 순환구문에 의하여 점을 출력하는 방식으로 코드를 짜신 것 같습니다. 이럴 경우에 첫 번째나 그 근처 값을 가지는 다른 값은 plot에 보일 수 있으나 그렇지 않은 경우에는 첫 번째 plot 영역 밖의 값이라면 보이지 않습니다. 최대값과 최소값을 미리 확인하여 이 영역을 미리 plot에 정의하는 방법이 있습니다. 그보다 편한 방법으로는 그 몇 개의 값을 가지는 data 를 추출하여 별도의 data 를 만든 다음에 그냥 plot 해보겠습니다.



python 2017-05 생각해보니 반복구문에서, 10000을 1000으로 나눈값의 나머지가 0일 때마다 x_1, y_1, y_2의 리스트 값의 일부 요소를 취해 x, y1, y2에 저장해야하는데, 기존의 반복문에서 요소가 아닌, 리스트 값 전체를 계속해서 복사하고 있더라구요..... 그래서 간단하게 리스트에서 요소값만 찾아 다른 변수에 저장하도록 넣어서 풀었습니다. 혹 궁금하신 분 있을지도 몰라 코드 아래 붙입니다. import numpy as np import pandas as pd import matplotlib.pyplot as plt dataset=pd.read_csv("Model 1 and 2 compariosn.csv"); y_1= dataset.iloc[:,1].values.astype(float) y_2= dataset.iloc[:,2].values.astype(float) x_1= dataset.iloc[:,0].values.astype(float) x = np.zeros(40, dtype=float) y1 = np.zeros(40, dtype=float) y2 = np.zeros(40, dtype=float) for step in range(x_1.size): if step % 250 == 0: stepnew=round(step/250) y1[stepnew] = y_1[step] y2[stepnew] = y_2[step] x[stepnew] = x_1[step] plt.scatter(x, y1, marker='o', color='b') plt.annotate('maximum: 0.3669', xy=(9991,0.3669), xytext=(6000,0.2), arrowprops=dict(arrowstyle="->", connectionstyle="arc3, rad=0.2")) plt.scatter(x, y2, marker='^', color='r') plt.annotate('maximum: 0.4869', xy=(9643,0.4869), xytext=(6000,0.65), arrowprops=dict(arrowstyle="->", connectionstyle="arc3, rad=-0.2")) plt.xlim(x.min()-1000, x.max()+1000) plt.ylim(0,1.0) plt.legend(loc='upper left', frameon=False) plt.show() 생각해보니 반복구문에서, 10000을 1000으로 나눈값의 나머지가 0일 때마다 x_1, y_1, y_2의 리스트 값의 일부 요소를 취해 x, y1, y2에 저장해야하는데, 기존의 반복문에서 요소가 아닌, 리스트 값 전체를 계속해서 복사하고 있더라구요..... 그래서 간단하게 리스트에서 요소값만 찾아 다른 변수에 저장하도록 넣어서 풀었습니다. 혹 궁금하신 분 있을지도 몰라 코드 아래 붙입니다. import numpy as np import pandas as pd import matplotlib.pyplot as plt dataset=pd.read_csv("Model 1 and 2 compariosn.csv"); y_1= dataset.iloc[:,1].values.astype(float) y_2= dataset.iloc[:,2].values.astype(float) x_1= dataset.iloc[:,0].values.astype(float) x = np.zeros(40, dtype=float) y1 = np.zeros(40, dtype=float) y2 = np.zeros(40, dtype=float) for step in range(x_1.size): if step % 250 == 0: stepnew=round(step/250) y1[stepnew] = y_1[step] y2[stepnew] = y_2[step] x[stepnew] = x_1[step] plt.scatter(x, y1, marker='o', color='b') plt.annotate('maximum: 0.3669', xy=(9991,0.3669), xytext=(6000,0.2), arrowprops=dict(arrowstyle="->", connectionstyle="arc3, rad=0.2")) plt.scatter(x, y2, marker='^', color='r') plt.annotate('maximum: 0.4869', xy=(9643,0.4869), xytext=(6000,0.65), arrowprops=dict(arrowstyle="->", connectionstyle="arc3, rad=-0.2")) plt.xlim(x.min()-1000, x.max()+1000) plt.ylim(0,1.0) plt.legend(loc='upper left', frameon=False) plt.show()

로그인 하시면 댓글을 남길 수 있습니다

쓰기

QnA

쓰기

2939/5711

번호	제목Page 2939/5711	글쓴이	날짜	조회	추천
	[필독] 처음 오시는 분을 위한 안내 (734)	정은준1	2014-05	5166139	0
[필독] 처음 오시는 분을 위한 안내 (734) 2014-05 5166139 1 정은준1
	(광고) 단통법 시대의 인터넷가입 가이드(ver2.0) (234)	백메가	2015-12	1700376	25
(광고) 단통법 시대의 인터넷가입 가이드(… (234) 2015-12 1700376 1 백메가
55454	윈도우 server 2008 R2 최대절전모드 활성화 (3)	턱주가리아	2016-03	5276	0
윈도우 server 2008 R2 최대절전모드 활성화 (3) 2016-03 5276 1 턱주가리아
55453	홈쇼핑에서의 가전제품 구입을 어떻게 생각하시는지.. (5)	가동윤	2006-11	5276	49
홈쇼핑에서의 가전제품 구입을 어떻게 생… (5) 2006-11 5276 1 가동윤
55452	듀얼 시스템 선택 여쭙니다. (2)	손석우	2009-03	5276	0
듀얼 시스템 선택 여쭙니다. (2) 2009-03 5276 1 손석우
55451	랜선 테스터기 추천해 주세요 (17)	정진환	2022-12	5276	0
랜선 테스터기 추천해 주세요 (17) 2022-12 5276 1 정진환
55450	S-ATA 속도에 관해 질문드립니다.. (2)	박재석	2005-12	5276	8
S-ATA 속도에 관해 질문드립니다.. (2) 2005-12 5276 1 박재석
55449	스토리지 서버에 대해서 알고 싶습니다. (4)	송재훈	2007-10	5276	2
스토리지 서버에 대해서 알고 싶습니다. (4) 2007-10 5276 1 송재훈
55448	레이드 성능 질문드립니다. (2)	김재식	2008-07	5276	17
레이드 성능 질문드립니다. (2) 2008-07 5276 1 김재식
55447	현재 시스템의 총 사용전력을 구하는 방법이 있습니까? (7)	민봉기	2006-10	5276	11
현재 시스템의 총 사용전력을 구하는 방법… (7) 2006-10 5276 1 민봉기
55446	혹시 HDD 개발하시는분 계실까요? (12)	이상훈	2008-03	5276	11
혹시 HDD 개발하시는분 계실까요? (12) 2008-03 5276 1 이상훈
55445	CPU Cooling 문제 문의드립니다 (6)	조재경	2008-07	5276	7
CPU Cooling 문제 문의드립니다 (6) 2008-07 5276 1 조재경
55444	mame 그리고 xmame	윤호용	2007-01	5276	18
mame 그리고 xmame 2007-01 5276 1 윤호용
55443	Tyan System Monitor 인터넷으로 쓰는 방법 (1)	박준용	2006-06	5276	17
Tyan System Monitor 인터넷으로 쓰는 방법 (1) 2006-06 5276 1 박준용
55442	p2p 용의 컴퓨터 문의 입니다. (12)	이종원	2007-02	5276	5
p2p 용의 컴퓨터 문의 입니다. (12) 2007-02 5276 1 이종원
55441	용산 전자상가 휴가 일정 아시는분 계신가요? (5)	서울I김동수	2014-07	5276	0
용산 전자상가 휴가 일정 아시는분 계신가… (5) 2014-07 5276 1 서울I김동수
55440	컨트롤러를 바꾼 후 운영체제를 발견 못합니다. (2)	차평석	2008-04	5276	8
컨트롤러를 바꾼 후 운영체제를 발견 못합… (2) 2008-04 5276 1 차평석
55439	구식보드에 고용량 하드 사용 가능 여부 (6)	이충희	2006-05	5276	8
구식보드에 고용량 하드 사용 가능 여부 (6) 2006-05 5276 1 이충희
55438	[아차차..]한가지 빠트렸네요... (5)	김현우	2007-12	5276	11
[아차차..]한가지 빠트렸네요... (5) 2007-12 5276 1 김현우
55437	[완료] 지금 "구글"(Google)에 연결이 안되는군요! (3)	영원한혁신	2012-11	5276	0
[완료] 지금 "구글"(Google)에 … (3) 2012-11 5276 1 영원한혁신
55436	[re] 32비트에서는 별반 차이 없습니다.. (1)	박석호	2007-08	5276	52
[re] 32비트에서는 별반 차이 없습니다.. (1) 2007-08 5276 1 박석호
55435	임베디드 SW 개발자가 디버깅에 소비하는 시간 (3)	김종성	2008-10	5276	7
임베디드 SW 개발자가 디버깅에 소비하는 … (3) 2008-10 5276 1 김종성