* 하이브의 내장 함수
함수 |
내용 |
concat(string a, string b, ...) |
문자열 a 뒤에 문자열 b를 붙여서 반환합니다. 예를 들어 concat('facebook', 'hive')를 수행하면 'facebookhive'를 반환합니다. |
substr(string str, int start) |
문자열 str의 start 인덱스에서 문자열의 마지막 인덱스까지를 잘라낸 문자열을 반환합니다. 예를 들어 substr('hadoop', 4)는 'oop'를 반환합니다. |
substr(string str, int start, int length) |
문자열 str의 start 인덱스에서 설정한 length 만큼을 잘라낸 문자열을 반환합니다. 예를 들어 substr('hadoop', 4, 2)라고 하면 'oo'를 반환합니다. |
upper(string str) |
문자열 str를 대문자로 변환해서 반환합니다. 예를 들어 -upper('hive')는 'HIVE'를 반환합니다. |
ucase(string str) |
upper 함수와 동일합니다. |
lower(string str) |
문자열 str을 소문자로 변환해서 반환합니다. 예를 들어 lower('HIVE')는 'hive'를 반환합니다. |
lcase(string str) |
Lower 함수와 동일합니다. |
trim(string str) |
문자열 str의 양쪽에 있는 공백을 제거합니다. 예를 들어 trim(' hive ')는 'hive'를 반환합니다. |
ltrim(string str) |
문자열 str의 왼쪽에 있는 공백을 제거합니다. 예를 들어 ltrim(' hive ')는 'hive '를 반환합니다. |
rtrim(string str) |
문자열 str의 오른쪽에 있는 공백을 제거합니다. 예를 들어 rtrim(' hive ')는 ' hive'를 반환합니다. |
regexp_replace(string str, string regex, string replacement) |
문자열 str에서 정규 표현식 regex와 일치하는 모든 문자열을 replacement로 변경해서 반환합니다. 예를 들어 regexp_replace('hive', 'iv', '')는 'he'를 반환합니다. |
from_unixtime(int unixtime) |
유닉스 시간 문자열(1970-01-01 00:00:00 UTC)을 현재 시스템의 시간대로 변경해서 반환합니다. |
to_date(string timestamp) |
타임스탬프 문자열에서 날짜값만 반환합니다. 예를 들어 to_date("2012-09-01 00:00:00")는 "2012-09-01"을 반환합니다. |
round(double a) |
double 값 a에 대한 반올림 정수값(BIGINT)을 반환합니다. |
floor(double a) |
double 값 a보다 작거나 같은 최대 정수값(BIGINT)을 반환합니다. |
ceil(double a) |
double 값 a보다 크거나 같은 최소한의 정수값(BIGINT)을 반환합니다. |
rand(), rand(int seed) |
랜덤값을 반환합니다. seed 파라미터로 랜덤값의 범위를 설정할 수 있습니다. |
year(string date) |
날짜 혹은 타임스탬프 문자열에서 년도만 반환합니다. 예를 들어 year("2012-09-01 00:00:00")은 "2012"를 반환합니다. |
month(string date) |
날짜 혹은 타임스탬프 문자열에서 월만 반환합니다. 예를 들어 month("2012-09-01 00:00:00")은 "09"를 반환합니다. |
day(string date) |
날짜 혹은 타임스탬프 문자열에서 일만 반환합니다. 예를 들어 day("2012-09-01 00:00:00")은 "01"를 반환합니다. |
get_json_object(string json_string, string path) |
디렉터리 path에서 문자열 json_string으로부터 json 객체를 추출하고 json 문자열로 반환합니다. 만약 json이 유효하지 않으면 null 값을 반환합니다. |
size(Map<K.V>) |
맵 타입의 엘리먼트의 개수를 반환합니다. |
size(Array<T>) |
배열 타입의 엘리먼트의 개수를 반환합니다. |
cast(<expr> as <type>) |
정규 표현식 expr을 type으로 타입을 변환합니다. 예를 들어 cast('100' as BIGINT)는 '100'을 BIGINT로 변환해서 반환합니다. 변환에 실패할 경우 null 값을 반환합니다. |
* 참고: 시작하세요! 하둡 프로그래밍
'Big Data Platform > Hive' 카테고리의 다른 글
[에러] Could not create ServerSocket on address 0.0.0.0/0.0.0.0:9083 (0) | 2018.01.15 |
---|---|
[에러] ls: cannot access '/usr/local/spark/lib/spark-assembly-*.jar': No such file or directory (0) | 2018.01.15 |
hive 내장 집계 함수 (0) | 2017.10.16 |
[경고] Establishing SSL connection without server's identity verification is not recommended. (0) | 2017.10.16 |
OPTION SQL_SELECT_LIMIT=DEFAULT (0) | 2017.10.16 |