python에서 읽어온 CSV 데이터를 일정간격으로 무시하고 scatter 그리기 질문..

쓰기

python에서 읽어온 CSV 데이터를 일정간격으로 무시하고 scatter 그리기 질문..

python

2017-05

2017-05-25 20:15:43

조회 5571 추천 1

혹 python 다루시는 분이 계실것 같아 여쭤봅니다..

python에서 CSV 데이터를 읽어 온 뒤 scatter로 뿌리는 문제입니다.

CSV 데이터는 x_1, y_1, y_2로 되어 있고, 각 10,000개 씩의 값을 가진 20,000개의 좌표점입니다.

이를 대략 x축을 기준으로 1000간격에 해당하는 좌표점만 띄엄띄엄 scatter로 뿌리고 싶습니다.

이를 반복문을 써서

for step in range(10001):

if step % 1000 == 0:

x = x_1

y1 = y_1

y2 = y_2

x_1, y_1, y_2의 데이터를 1000간격씩 x, y1, y2에 새로 저장해

x,y1 그리고 x,y2를 scatter로 뿌리면 될꺼라 생각했는데, 생각이랑 다르게 안되네요.

어떻게 해야될까요..

아래는 제가 짜본 코드입니다.

import pandas as pd
import matplotlib.pyplot as plt

dataset=pd.read_csv("Basic.csv");
y_1= dataset.iloc[:,1].values.astype(float)
y_2= dataset.iloc[:,2].values.astype(float)
x_1= dataset.iloc[:,0].values.astype(float)


for step in range(10001):
    if step % 1000 == 0:
        y1 = y_1
        y2 = y_2
        x = x_1


plt.scatter(x, y1, marker='s', color='b')
plt.annotate('maximum: 0.3669', xy=(9991,0.3669), xytext=(6000,0.2), arrowprops=dict(arrowstyle="->", connectionstyle="arc3, rad=0.2"))

plt.scatter(x, y2, marker='^', color='r')
plt.annotate('maximum: 0.4869', xy=(9643,0.4869), xytext=(6000,0.65), arrowprops=dict(arrowstyle="->", connectionstyle="arc3, rad=-0.2"))


plt.ylim(0,1.0)

plt.legend(loc='upper left', frameon=False)

plt.show()

짧은글 일수록 신중하게.



변선주 2017-05 python은 잘 모릅니다만, 제가 사용하는 R에서 저라면 다음과 같은 방법으로 문제를 풀어보겠습니다. 순환구문에 의하여 점을 출력하는 방식으로 코드를 짜신 것 같습니다. 이럴 경우에 첫 번째나 그 근처 값을 가지는 다른 값은 plot에 보일 수 있으나 그렇지 않은 경우에는 첫 번째 plot 영역 밖의 값이라면 보이지 않습니다. 최대값과 최소값을 미리 확인하여 이 영역을 미리 plot에 정의하는 방법이 있습니다. 그보다 편한 방법으로는 그 몇 개의 값을 가지는 data 를 추출하여 별도의 data 를 만든 다음에 그냥 plot 해보겠습니다. python은 잘 모릅니다만, 제가 사용하는 R에서 저라면 다음과 같은 방법으로 문제를 풀어보겠습니다. 순환구문에 의하여 점을 출력하는 방식으로 코드를 짜신 것 같습니다. 이럴 경우에 첫 번째나 그 근처 값을 가지는 다른 값은 plot에 보일 수 있으나 그렇지 않은 경우에는 첫 번째 plot 영역 밖의 값이라면 보이지 않습니다. 최대값과 최소값을 미리 확인하여 이 영역을 미리 plot에 정의하는 방법이 있습니다. 그보다 편한 방법으로는 그 몇 개의 값을 가지는 data 를 추출하여 별도의 data 를 만든 다음에 그냥 plot 해보겠습니다.



python 2017-05 생각해보니 반복구문에서, 10000을 1000으로 나눈값의 나머지가 0일 때마다 x_1, y_1, y_2의 리스트 값의 일부 요소를 취해 x, y1, y2에 저장해야하는데, 기존의 반복문에서 요소가 아닌, 리스트 값 전체를 계속해서 복사하고 있더라구요..... 그래서 간단하게 리스트에서 요소값만 찾아 다른 변수에 저장하도록 넣어서 풀었습니다. 혹 궁금하신 분 있을지도 몰라 코드 아래 붙입니다. import numpy as np import pandas as pd import matplotlib.pyplot as plt dataset=pd.read_csv("Model 1 and 2 compariosn.csv"); y_1= dataset.iloc[:,1].values.astype(float) y_2= dataset.iloc[:,2].values.astype(float) x_1= dataset.iloc[:,0].values.astype(float) x = np.zeros(40, dtype=float) y1 = np.zeros(40, dtype=float) y2 = np.zeros(40, dtype=float) for step in range(x_1.size): if step % 250 == 0: stepnew=round(step/250) y1[stepnew] = y_1[step] y2[stepnew] = y_2[step] x[stepnew] = x_1[step] plt.scatter(x, y1, marker='o', color='b') plt.annotate('maximum: 0.3669', xy=(9991,0.3669), xytext=(6000,0.2), arrowprops=dict(arrowstyle="->", connectionstyle="arc3, rad=0.2")) plt.scatter(x, y2, marker='^', color='r') plt.annotate('maximum: 0.4869', xy=(9643,0.4869), xytext=(6000,0.65), arrowprops=dict(arrowstyle="->", connectionstyle="arc3, rad=-0.2")) plt.xlim(x.min()-1000, x.max()+1000) plt.ylim(0,1.0) plt.legend(loc='upper left', frameon=False) plt.show() 생각해보니 반복구문에서, 10000을 1000으로 나눈값의 나머지가 0일 때마다 x_1, y_1, y_2의 리스트 값의 일부 요소를 취해 x, y1, y2에 저장해야하는데, 기존의 반복문에서 요소가 아닌, 리스트 값 전체를 계속해서 복사하고 있더라구요..... 그래서 간단하게 리스트에서 요소값만 찾아 다른 변수에 저장하도록 넣어서 풀었습니다. 혹 궁금하신 분 있을지도 몰라 코드 아래 붙입니다. import numpy as np import pandas as pd import matplotlib.pyplot as plt dataset=pd.read_csv("Model 1 and 2 compariosn.csv"); y_1= dataset.iloc[:,1].values.astype(float) y_2= dataset.iloc[:,2].values.astype(float) x_1= dataset.iloc[:,0].values.astype(float) x = np.zeros(40, dtype=float) y1 = np.zeros(40, dtype=float) y2 = np.zeros(40, dtype=float) for step in range(x_1.size): if step % 250 == 0: stepnew=round(step/250) y1[stepnew] = y_1[step] y2[stepnew] = y_2[step] x[stepnew] = x_1[step] plt.scatter(x, y1, marker='o', color='b') plt.annotate('maximum: 0.3669', xy=(9991,0.3669), xytext=(6000,0.2), arrowprops=dict(arrowstyle="->", connectionstyle="arc3, rad=0.2")) plt.scatter(x, y2, marker='^', color='r') plt.annotate('maximum: 0.4869', xy=(9643,0.4869), xytext=(6000,0.65), arrowprops=dict(arrowstyle="->", connectionstyle="arc3, rad=-0.2")) plt.xlim(x.min()-1000, x.max()+1000) plt.ylim(0,1.0) plt.legend(loc='upper left', frameon=False) plt.show()

로그인 하시면 댓글을 남길 수 있습니다

쓰기

QnA

쓰기

4152/5715

번호	제목Page 4152/5715	글쓴이	날짜	조회	추천
	(광고) 단통법 시대의 인터넷가입 가이드(ver2.0) (234)	백메가	2015-12	1730305	25
(광고) 단통법 시대의 인터넷가입 가이드(… (234) 2015-12 1730305 1 백메가
	[필독] 처음 오시는 분을 위한 안내 (736)	정은준1	2014-05	5197573	0
[필독] 처음 오시는 분을 위한 안내 (736) 2014-05 5197573 1 정은준1
31271	미대 학부 컴퓨터 그래픽 전공 학생용 마야 시스템으로 이 사양 괜찮을까요? (14)	audacity	2020-08	3183	1
미대 학부 컴퓨터 그래픽 전공 학생용 마… (14) 2020-08 3183 1 audacity
31270	이베이 cpu 판매광고에 Matched Pair (6)	알파고	2017-02	4518	1
이베이 cpu 판매광고에 Matched Pair (6) 2017-02 4518 1 알파고
31269	리눅스 파티션 사이즈 조절 (9)	리오	2017-03	4472	1
리눅스 파티션 사이즈 조절 (9) 2017-03 4472 1 리오
31268	[해결?] 메모리 부족 팝업... 도움말씀 구합니다. (19)	네오네모	2017-04	6464	1
[해결?] 메모리 부족 팝업... 도움말씀 구… (19) 2017-04 6464 1 네오네모
31267	sata 케이블은 말랑말랑한게 좋은건가요? 아님 좀 딱딱한게 좋은 건가요? (11)	늘파란	2017-04	4114	1
sata 케이블은 말랑말랑한게 좋은건가요? … (11) 2017-04 4114 1 늘파란
31266	파워 중고 구입 문의 합니다. (15)	차넷컴퓨터	2016-06	6176	1
파워 중고 구입 문의 합니다. (15) 2016-06 6176 1 차넷컴퓨터
31265	python에서 읽어온 CSV 데이터를 일정간격으로 무시하고 scatter 그리기 질문.. (2)	python	2017-05	5572	1
python에서 읽어온 CSV 데이터를 일정간격… (2) 2017-05 5572 1 python
31264	dell ml110 G7 열쇄 판매하는곳이 있을까요? (6)	봄들판에서다	2016-06	4486	1
dell ml110 G7 열쇄 판매하는곳이 있을까… (6) 2016-06 4486 1 봄들판에서다
31263	[질문] Intel SSD DC S4500 480G vs 삼성 860 Pro 500G 의 차이 (49)	페르세우스	2018-09	7063	1
[질문] Intel SSD DC S4500 480G vs 삼성 … (49) 2018-09 7063 1 페르세우스
31262	FLIR AXXX시리즈 열화상 카메라 사용/보유중이신 분이 계실까요? (1)	Psychophysi…	2017-06	3386	1
FLIR AXXX시리즈 열화상 카메라 사용/보유… (1) 2017-06 3386 1 Psychophysi…
31261	놋북패널과 메인보드 직접연결 방법은? (2)	NiteFlite9	2017-06	3096	1
놋북패널과 메인보드 직접연결 방법은? (2) 2017-06 3096 1 NiteFlite9
31260	리눅스 php 재설치 (6)	김황중	2016-07	4915	1
리눅스 php 재설치 (6) 2016-07 4915 1 김황중
31259	업무용으로 쓰는 보드는 어느회사것 쓰시나요? (19)	미수맨	2016-07	4814	1
업무용으로 쓰는 보드는 어느회사것 쓰시… (19) 2016-07 4814 1 미수맨
31258	요즘 문제가 되는 시게이트 하드 (5)	한성확	2009-01	5672	1
요즘 문제가 되는 시게이트 하드 (5) 2009-01 5672 1 한성확
31257	파워의 8핀, 2011팬에 대한 궁굼증이 있습니다. (18)	Everyharu	2016-09	4472	1
파워의 8핀, 2011팬에 대한 궁굼증이 있습… (18) 2016-09 4472 1 Everyharu
31256	Nginx Virtual host 셋팅 관련 질문 (해결됨) (5)	조형	2018-01	3835	1
Nginx Virtual host 셋팅 관련 질문 (해결… (5) 2018-01 3835 1 조형
31255	외장 하드를 하나 사려고 하는데.... (4)	박성만	2016-05	4530	1
외장 하드를 하나 사려고 하는데.... (4) 2016-05 4530 1 박성만
31254	DDR3에서 10600 하고 12800, 14900 에 대해서... (11)	e5472	2016-06	9871	1
DDR3에서 10600 하고 12800, 14900 에 대… (11) 2016-06 9871 1 e5472
31253	AD보드 잘 아시는분 계신가요? (1)	PCMaster	2016-06	4405	1
AD보드 잘 아시는분 계신가요? (1) 2016-06 4405 1 PCMaster
31252	리눅스 서버 백업 또는 백업 업체 있을까요? (6)	쿠르	2017-06	4413	1
리눅스 서버 백업 또는 백업 업체 있을까… (6) 2017-06 4413 1 쿠르