최근 게시물

자유게시판 more

쓰기

python에서 읽어온 CSV 데이터를 일정간격으로 무시하고 scatter 그리기 질문..

python

2017-05

2017-05-25 20:15:43

조회 4572 추천 1

혹 python 다루시는 분이 계실것 같아 여쭤봅니다..

python에서 CSV 데이터를 읽어 온 뒤 scatter로 뿌리는 문제입니다.

CSV 데이터는 x_1, y_1, y_2로 되어 있고, 각 10,000개 씩의 값을 가진 20,000개의 좌표점입니다.

이를 대략 x축을 기준으로 1000간격에 해당하는 좌표점만 띄엄띄엄 scatter로 뿌리고 싶습니다.

이를 반복문을 써서

for step in range(10001):

if step % 1000 == 0:

x = x_1

y1 = y_1

y2 = y_2

x_1, y_1, y_2의 데이터를 1000간격씩 x, y1, y2에 새로 저장해

x,y1 그리고 x,y2를 scatter로 뿌리면 될꺼라 생각했는데, 생각이랑 다르게 안되네요.

어떻게 해야될까요..

아래는 제가 짜본 코드입니다.

import pandas as pd
import matplotlib.pyplot as plt

dataset=pd.read_csv("Basic.csv");
y_1= dataset.iloc[:,1].values.astype(float)
y_2= dataset.iloc[:,2].values.astype(float)
x_1= dataset.iloc[:,0].values.astype(float)


for step in range(10001):
    if step % 1000 == 0:
        y1 = y_1
        y2 = y_2
        x = x_1


plt.scatter(x, y1, marker='s', color='b')
plt.annotate('maximum: 0.3669', xy=(9991,0.3669), xytext=(6000,0.2), arrowprops=dict(arrowstyle="->", connectionstyle="arc3, rad=0.2"))

plt.scatter(x, y2, marker='^', color='r')
plt.annotate('maximum: 0.4869', xy=(9643,0.4869), xytext=(6000,0.65), arrowprops=dict(arrowstyle="->", connectionstyle="arc3, rad=-0.2"))


plt.ylim(0,1.0)

plt.legend(loc='upper left', frameon=False)

plt.show()

짧은글 일수록 신중하게.



변선주 2017-05 python은 잘 모릅니다만, 제가 사용하는 R에서 저라면 다음과 같은 방법으로 문제를 풀어보겠습니다. 순환구문에 의하여 점을 출력하는 방식으로 코드를 짜신 것 같습니다. 이럴 경우에 첫 번째나 그 근처 값을 가지는 다른 값은 plot에 보일 수 있으나 그렇지 않은 경우에는 첫 번째 plot 영역 밖의 값이라면 보이지 않습니다. 최대값과 최소값을 미리 확인하여 이 영역을 미리 plot에 정의하는 방법이 있습니다. 그보다 편한 방법으로는 그 몇 개의 값을 가지는 data 를 추출하여 별도의 data 를 만든 다음에 그냥 plot 해보겠습니다. python은 잘 모릅니다만, 제가 사용하는 R에서 저라면 다음과 같은 방법으로 문제를 풀어보겠습니다. 순환구문에 의하여 점을 출력하는 방식으로 코드를 짜신 것 같습니다. 이럴 경우에 첫 번째나 그 근처 값을 가지는 다른 값은 plot에 보일 수 있으나 그렇지 않은 경우에는 첫 번째 plot 영역 밖의 값이라면 보이지 않습니다. 최대값과 최소값을 미리 확인하여 이 영역을 미리 plot에 정의하는 방법이 있습니다. 그보다 편한 방법으로는 그 몇 개의 값을 가지는 data 를 추출하여 별도의 data 를 만든 다음에 그냥 plot 해보겠습니다.



python 2017-05 생각해보니 반복구문에서, 10000을 1000으로 나눈값의 나머지가 0일 때마다 x_1, y_1, y_2의 리스트 값의 일부 요소를 취해 x, y1, y2에 저장해야하는데, 기존의 반복문에서 요소가 아닌, 리스트 값 전체를 계속해서 복사하고 있더라구요..... 그래서 간단하게 리스트에서 요소값만 찾아 다른 변수에 저장하도록 넣어서 풀었습니다. 혹 궁금하신 분 있을지도 몰라 코드 아래 붙입니다. import numpy as np import pandas as pd import matplotlib.pyplot as plt dataset=pd.read_csv("Model 1 and 2 compariosn.csv"); y_1= dataset.iloc[:,1].values.astype(float) y_2= dataset.iloc[:,2].values.astype(float) x_1= dataset.iloc[:,0].values.astype(float) x = np.zeros(40, dtype=float) y1 = np.zeros(40, dtype=float) y2 = np.zeros(40, dtype=float) for step in range(x_1.size): if step % 250 == 0: stepnew=round(step/250) y1[stepnew] = y_1[step] y2[stepnew] = y_2[step] x[stepnew] = x_1[step] plt.scatter(x, y1, marker='o', color='b') plt.annotate('maximum: 0.3669', xy=(9991,0.3669), xytext=(6000,0.2), arrowprops=dict(arrowstyle="->", connectionstyle="arc3, rad=0.2")) plt.scatter(x, y2, marker='^', color='r') plt.annotate('maximum: 0.4869', xy=(9643,0.4869), xytext=(6000,0.65), arrowprops=dict(arrowstyle="->", connectionstyle="arc3, rad=-0.2")) plt.xlim(x.min()-1000, x.max()+1000) plt.ylim(0,1.0) plt.legend(loc='upper left', frameon=False) plt.show() 생각해보니 반복구문에서, 10000을 1000으로 나눈값의 나머지가 0일 때마다 x_1, y_1, y_2의 리스트 값의 일부 요소를 취해 x, y1, y2에 저장해야하는데, 기존의 반복문에서 요소가 아닌, 리스트 값 전체를 계속해서 복사하고 있더라구요..... 그래서 간단하게 리스트에서 요소값만 찾아 다른 변수에 저장하도록 넣어서 풀었습니다. 혹 궁금하신 분 있을지도 몰라 코드 아래 붙입니다. import numpy as np import pandas as pd import matplotlib.pyplot as plt dataset=pd.read_csv("Model 1 and 2 compariosn.csv"); y_1= dataset.iloc[:,1].values.astype(float) y_2= dataset.iloc[:,2].values.astype(float) x_1= dataset.iloc[:,0].values.astype(float) x = np.zeros(40, dtype=float) y1 = np.zeros(40, dtype=float) y2 = np.zeros(40, dtype=float) for step in range(x_1.size): if step % 250 == 0: stepnew=round(step/250) y1[stepnew] = y_1[step] y2[stepnew] = y_2[step] x[stepnew] = x_1[step] plt.scatter(x, y1, marker='o', color='b') plt.annotate('maximum: 0.3669', xy=(9991,0.3669), xytext=(6000,0.2), arrowprops=dict(arrowstyle="->", connectionstyle="arc3, rad=0.2")) plt.scatter(x, y2, marker='^', color='r') plt.annotate('maximum: 0.4869', xy=(9643,0.4869), xytext=(6000,0.65), arrowprops=dict(arrowstyle="->", connectionstyle="arc3, rad=-0.2")) plt.xlim(x.min()-1000, x.max()+1000) plt.ylim(0,1.0) plt.legend(loc='upper left', frameon=False) plt.show()

로그인 하시면 댓글을 남길 수 있습니다

쓰기

그룹	게시판	제목	글쓴이	날짜	조회
2CPU	자유게시판	캡쳐보드 주워왔습니다. (1) 어른이 09:23	어른이	09:23	59	캡쳐보드 주워왔습니다. (1) 2CPU : 자유게시판 09:23 59 어른이
2CPU	QnA	서버용 SSD 삼성 990 PRO 와 마이크론 T70… (2) 호호 09:14	호호	09:14	44	서버용 SSD 삼성 990 PRO 와 마이크론 T70… (2) 2CPU : QnA 09:14 44 호호
2CPU	판매	티브이 대용/넷플릭스,유투브 시청용PT-RZ… (1) 범어리 08:36	범어리	08:36	21	티브이 대용/넷플릭스,유투브 시청용PT-RZ… (1) 2CPU : 판매 08:36 21 범어리
2CPU	판매	엡손 각종 레이저 프로젝터 박스개봉 미사… (1) 범어리 08:35	범어리	08:35	10	엡손 각종 레이저 프로젝터 박스개봉 미사… (1) 2CPU : 판매 08:35 10 범어리
2CPU	판매	미개봉 새제품 타거스 DOCK310USZ (9포트/… (1) 프랜드 07:53	프랜드	07:53	30	미개봉 새제품 타거스 DOCK310USZ (9포트/… (1) 2CPU : 판매 07:53 30 프랜드
2CPU	판매	HP z840 E5-2699v3 2, 2696V42 / 256G,5… (1) 프랜드 07:52	프랜드	07:52	47	HP z840 E5-2699v3 2, 2696V42 / 256G,5… (1) 2CPU : 판매 07:52 47 프랜드
2CPU	판매	(SSD) SAMSUNG 870 EVO (1TB, 2TB) (1) 페더아이티 04-26	페더아이티	04-26	272	(SSD) SAMSUNG 870 EVO (1TB, 2TB) (1) 2CPU : 판매 04-26 272 페더아이티
2CPU	QnA	[요청] A10-9700 프로세서 장착 HP EliteD… (4) 새총 04-26	새총	04-26	255	[요청] A10-9700 프로세서 장착 HP EliteD… (4) 2CPU : QnA 04-26 255 새총
2CPU	자유게시판	[줍줍] 아이스크림 홈런 노트북 (5) 박문형 04-26	박문형	04-26	307	[줍줍] 아이스크림 홈런 노트북 (5) 2CPU : 자유게시판 04-26 307 박문형
2CPU	QnA	hoksi 회원님들 중국산 풀메탈건 구입해보… 정은준1 04-26	정은준1	04-26	203	hoksi 회원님들 중국산 풀메탈건 구입해보… 2CPU : QnA 04-26 203 정은준1
2CPU	구매	Z840 파워 구매합니다 ok해피컴 04-26	ok해피컴	04-26	38	Z840 파워 구매합니다 2CPU : 구매 04-26 38 ok해피컴
2CPU	QnA	ㄴ자 모양 지지대 기성품 또는 제작 가능… (5) 크리미 04-26	크리미	04-26	182	ㄴ자 모양 지지대 기성품 또는 제작 가능… (5) 2CPU : QnA 04-26 182 크리미
2CPU	자유게시판	노란우산공제 (3) 편한세상 04-26	편한세상	04-26	177	노란우산공제 (3) 2CPU : 자유게시판 04-26 177 편한세상
2CPU	판매	[56Core/112TH] 델 T7920 Platinum 8173M,… (1) 프랜드 04-26	프랜드	04-26	126	[56Core/112TH] 델 T7920 Platinum 8173M,… (1) 2CPU : 판매 04-26 126 프랜드
2CPU	자유게시판	코딩테스트는 풀다가 답안나오면 답보는게… (5) piedPiper 04-26	piedPiper	04-26	285	코딩테스트는 풀다가 답안나오면 답보는게… (5) 2CPU : 자유게시판 04-26 285 piedPiper