9.14. Examples: Reading the lines of a file that contain a pattern (instead of a specific word).

Print the line(s) of file3.csv that start with B. $ grep '^B' file3.csv
B12226507,Group1,68
B12226546,Group1,67
B11119903,Group2 b,83
B11108399,Group1,23
B11108326,Group1,59
B11119909,Group2 b,61
B11110893,Group1,28

Print the line(s) of test7.csv that end with 13. $ grep '13$' file3.csv
C11137159,Group3,13
C11137159,Group3,13
D11144030,Group3,13

Print the line(s) of test7.csv that end with 13 (when this pattern is stored in a file called patterns2.txt). $ cat patterns2.txt
13$

$ grep -f patterns2.txt file3.csv
C11137159,Group3,13
C11137159,Group3,13
D11144030,Group3,13

Print all the non-empty lines (lines with more than 0 fields NF > 0) in file3.csv and file4.txt.

Space-separated file	Comma-separated file
$ awk 'NF > 0' file4.txt AnonymizedID SubjectGroup AGE B11108326 Group1 59 B11108399 Group1 23 B11110893 Group1 28 B11119909 Group2 61 D11144030 Group3 11 D11144030 Group3 13 B11119903 Group2 84 C11131039 Group2 67 C11133100 Group1 23 C11135566 Group2 72 C11137159 Group3 11 C11137159 Group3 12 C11137167 Group3 14 C11137167 Group3 16 C11137439 Group3 15 C11137439 Group3 79 C11137443 Group3 15 C11137544 Group1 22 C11137123 Group2 68 C11138150 Group1 44 C11138152 Group1 10 C11138797 Group1 24 C11138184 Group1 57 C11138122 Group1 23 C11138122 MISSING 25 C11138192 Group1 45 B12226507 Group1 26 B12226546 Group1 55	$ awk -F',' 'NF > 0' file3.csv Anonymized ID,Subject Group,AGE C11138122,MISSING,21 C11138192,Group1,54 B12226507,Group1,68 B12226546,Group1,67 C11138122,Group1,24 C11138184,Group1,59 C11138797,Group1,22 C11138152,Group1,53 C11138150,Group1,41 C11137167,Group3,14 C11137159,Group3,13 C11137167,Group3,16 C11137159,Group3,13 C11131039,Group2 b,67 C11135566,Group2 b,73 B11119903,Group2 b,83 C11137544,Group1,21 C11137443,Group3,11 C11137123,Group2 b,69 C11137439,Group3,79 C11137439,Group3,15 C11133100,Group1,23 D11144030,Group3,13 B11108399,Group1,23 B11108326,Group1,59 B11119909,Group2 b,61 B11110893,Group1,28

Space-separated file

Comma-separated file

$ awk 'NF > 0' file4.txt
AnonymizedID SubjectGroup AGE
B11108326 Group1 59
B11108399 Group1 23
B11110893 Group1 28
B11119909 Group2 61
D11144030 Group3 11
D11144030 Group3 13
B11119903 Group2 84
C11131039 Group2 67
C11133100 Group1 23
C11135566 Group2 72
C11137159 Group3 11
C11137159 Group3 12
C11137167 Group3 14
C11137167 Group3 16
C11137439 Group3 15
C11137439 Group3 79
C11137443 Group3 15
C11137544 Group1 22
C11137123 Group2 68
C11138150 Group1 44
C11138152 Group1 10
C11138797 Group1 24
C11138184 Group1 57
C11138122 Group1 23
C11138122 MISSING 25
C11138192 Group1 45
B12226507 Group1 26
B12226546 Group1 55

$ awk -F',' 'NF > 0' file3.csv
Anonymized ID,Subject Group,AGE
C11138122,MISSING,21
C11138192,Group1,54
B12226507,Group1,68
B12226546,Group1,67
C11138122,Group1,24
C11138184,Group1,59
C11138797,Group1,22
C11138152,Group1,53
C11138150,Group1,41
C11137167,Group3,14
C11137159,Group3,13
C11137167,Group3,16
C11137159,Group3,13
C11131039,Group2 b,67
C11135566,Group2 b,73
B11119903,Group2 b,83
C11137544,Group1,21
C11137443,Group3,11
C11137123,Group2 b,69
C11137439,Group3,79
C11137439,Group3,15
C11133100,Group1,23
D11144030,Group3,13
B11108399,Group1,23
B11108326,Group1,59
B11119909,Group2 b,61
B11110893,Group1,28

Print all the lines that have more than two fields (NF > 2) in file3.csv and file4.txt.

Space-separated file	Comma-separated file
$ awk 'NF > 2' file4.txt AnonymizedID SubjectGroup AGE B11108326 Group1 59 B11108399 Group1 23 B11110893 Group1 28 B11119909 Group2 61 D11144030 Group3 11 D11144030 Group3 13 B11119903 Group2 84 C11131039 Group2 67 C11133100 Group1 23 C11135566 Group2 72 C11137159 Group3 11 C11137159 Group3 12 C11137167 Group3 14 C11137167 Group3 16 C11137439 Group3 15 C11137439 Group3 79 C11137443 Group3 15 C11137544 Group1 22 C11137123 Group2 68 C11138150 Group1 44 C11138152 Group1 10 C11138797 Group1 24 C11138184 Group1 57 C11138122 Group1 23 C11138122 MISSING 25 C11138192 Group1 45 B12226507 Group1 26 B12226546 Group1 55	$ awk -F',' 'NF > 2' file3.csv Anonymized ID,Subject Group,AGE C11138122,MISSING,21 C11138192,Group1,54 B12226507,Group1,68 B12226546,Group1,67 C11138122,Group1,24 C11138184,Group1,59 C11138797,Group1,22 C11138152,Group1,53 C11138150,Group1,41 C11137167,Group3,14 C11137159,Group3,13 C11137167,Group3,16 C11137159,Group3,13 C11131039,Group2 b,67 C11135566,Group2 b,73 B11119903,Group2 b,83 C11137544,Group1,21 C11137443,Group3,11 C11137123,Group2 b,69 C11137439,Group3,79 C11137439,Group3,15 C11133100,Group1,23 D11144030,Group3,13 B11108399,Group1,23 B11108326,Group1,59 B11119909,Group2 b,61 B11110893,Group1,28

Space-separated file

Comma-separated file

$ awk 'NF > 2' file4.txt
AnonymizedID SubjectGroup AGE
B11108326 Group1 59
B11108399 Group1 23
B11110893 Group1 28
B11119909 Group2 61
D11144030 Group3 11
D11144030 Group3 13
B11119903 Group2 84
C11131039 Group2 67
C11133100 Group1 23
C11135566 Group2 72
C11137159 Group3 11
C11137159 Group3 12
C11137167 Group3 14
C11137167 Group3 16
C11137439 Group3 15
C11137439 Group3 79
C11137443 Group3 15
C11137544 Group1 22
C11137123 Group2 68
C11138150 Group1 44
C11138152 Group1 10
C11138797 Group1 24
C11138184 Group1 57
C11138122 Group1 23
C11138122 MISSING 25
C11138192 Group1 45
B12226507 Group1 26
B12226546 Group1 55

$ awk -F',' 'NF > 2' file3.csv
Anonymized ID,Subject Group,AGE
C11138122,MISSING,21
C11138192,Group1,54
B12226507,Group1,68
B12226546,Group1,67
C11138122,Group1,24
C11138184,Group1,59
C11138797,Group1,22
C11138152,Group1,53
C11138150,Group1,41
C11137167,Group3,14
C11137159,Group3,13
C11137167,Group3,16
C11137159,Group3,13
C11131039,Group2 b,67
C11135566,Group2 b,73
B11119903,Group2 b,83
C11137544,Group1,21
C11137443,Group3,11
C11137123,Group2 b,69
C11137439,Group3,79
C11137439,Group3,15
C11133100,Group1,23
D11144030,Group3,13
B11108399,Group1,23
B11108326,Group1,59
B11119909,Group2 b,61
B11110893,Group1,28