kulyutmaz
💻 Bilgisayar, 💾 Programlama

PL: Lexical Analyzer

KülyutmazKülyutmaz 1.0, Gül Deliorman ile beraber geliştirdiğimiz bir Lexical Analyzer ve Parser’dır. Ödevde bize verilen dilin kurallarına uygun her şeyi kabul ederken, kurallara aykırı hiçbir şeyi kabul etmemekte, kısaca kül yutmamaktadır.

JAVA’nın String Tokenizer nesnesi metnimizi tokenlarına istediğimiz gibi ayırmayı beceremediği için, tüm metni harf harf analiz ederek kendimiz ayırmaktayız.

Program ödevde istenen ve istenmeyen tüm kodlama yanlışlarını kontrol eder. Örneğin her kodu bir satıra yazmak zorunda değilsiniz. “;” gelene kadarki tüm karakterler bir kodun parçasıdır. İster bir satıra 30 kod yazın, ister 30 satıra bir kod, program için fark etmeyecektir. Parantez sayıları ve yerleri de tutmalıdır, üşenmedik onu da kontrol ettik. Programımızın boşluklarla herhangi bir sorunu yoktur. Örneğin,
deneme := 123 + 768 ;
deseniz dahi program çalışacaktır.

Daha çılgın deneyleri size bırakıyoruz.

Kaynak kodunu sadece örnek almak ve fikir edinmek amacıyla kullanabilirsiniz. Kaynak kodunu indirmek istemezseniz, bir kopyasına aşağıdan ulaşabilirsiniz.

Herkese iyi vizeler.

import java.util.Vector;
import java.io.BufferedReader;
import java.io.FileReader;
import java.io.IOException;

/**
 * @author Gergefil
 * @author Gülügül
 */
public class Main {

	/**
	 * @param args
	 */
	public static void main(String[] args) {
		System.out.println("Külyutmaz 1.0");
		System.out.println("Lexical Analyzer and TOPALOGLU++ Languange Parser");
		System.out.println("05-06-7699 Umut BENZER");
		System.out.println("05-06-7670 Gül DELİORMAN\n");
		
		String girdi = new String();
		try {
			final BufferedReader in = new BufferedReader(new FileReader("text.txt"));
			String txt = null;
			while ((txt = in.readLine()) != null) {
				girdi = girdi + txt;
			}
			in.close();
		} catch (final IOException e) {
			System.out.println("Erör: text.txt dosyası okunamadı. Lütfen bilgisayarınızı camdan aşağı atınız! :)");
			System.exit(0);
		}
		
		String one_word= "";
		for(int i = 0; i<girdi.length();i++) { /* Bu kısımda satır satır ayrıştırırız. */
			if(girdi.charAt(i) == ';') {
				System.out.println("\n\nSıradaki komut: " + one_word + ';');
				
				int sayac = 0;
				String temp = "";
				String left = "";
				String right = "";
				boolean cik = false;
				
				for(int x = 0; x<one_word.length();x++) { /* Bir satır gezilir ve sağ ve sol değişkenlerine ayrıştırılır. */
					if(one_word.charAt(x) == ':' && one_word.length() > x  && one_word.charAt(x+1) == '=') {						
						if (sayac==0) { 
							left = temp;
							/* System.out.println("Sol: " + left + "|"); // Kodun sol kısmını görmek için commenti kaldırın. */
							temp = "";
							x++;
						} else { 
							System.out.println("Erör: Satırda birden çok := ataması var!");
							cik = true;
							break;
						}
						sayac++;	
					} else {
						temp = temp + one_word.charAt(x);						
					}
				}
				if (cik == true) {one_word = ""; continue; }/* Eğer := hatası varsa daha ne kontrol edeyim ki satırın kalanını! */
				right = temp;
				/* System.out.println("Sağ: " + right + "|"); // Kodun sağ kısmını görmek için commenti kaldırınç */
				
				if (!is_variable(left)) {
					System.out.println("Erör: Sol taraf değişkeni hatalı!"); 
					one_word = ""; 
					continue; 
				}
				System.out.println("symbol (':=')");				
				is_operation(right);
				one_word = "";
			} else {
				one_word = one_word + girdi.charAt(i);
			}
		}
		if (one_word.trim() != "") System.out.println("Erör: Kodun en sonunda fazlalık var.");
	}
	
	/**
	 * Gönderilen Stringin geçerli bir variable olup olmadığını bulur
	 * @param suspect
	 * @return boolean
	 */
	public static boolean is_variable(String suspect) {	
		suspect = suspect.trim();		
		for (int e = 0; e < suspect.length(); e++) {
			if (!is_character(suspect.charAt(e))) return false;
		}
		System.out.println("variable ('" + suspect + "')"); 
		return true;
	}
	
	/**
	 * Gönderilen stringin geçerli bir sağ taraf işlemi olup olmadığını bulur.
	 * @param data
	 * @return boolean
	 */
	public static boolean is_operation(String data) {
		
		int index = 0;
		int parantez = 0;
		Vector<String> expected = new Vector<String>();
		
		expected.add("char");
		expected.add("space");
		expected.add("-number");
		expected.add("*");
		expected.add("number");
		expected.add("parantez-ac");

		while (1==1) {
			if (index == data.length()) {
				if (parantez != 0) { System.out.println("Erör: Açık kalan parantez var."); return false; }
				if (!expected.contains("finish")) { System.out.println("Erör: Komut sonu beklenmiyordu."); return false; }
				System.out.println("symbol (';')"); 
				return true;				
			}
			if (data.charAt(index) == '(' && expected.contains("parantez-ac")) {
				System.out.println("symbol ('(')"); 
				
				parantez++;
				index++;
				expected.clear();
				expected.add("char");
				expected.add("space");
				expected.add("-number");
				expected.add("number");
				expected.add("parantez-ac");
				continue;
			} else if (data.charAt(index) == ')' && expected.contains("parantez-kapa")) {
				parantez--;
				index++;
				if (parantez < 0) { System.out.println("Erör: Parantezler gereğinden fazla kapanmış."); return false; }
				System.out.println("symbol (')')"); 
				
				expected.clear();
				expected.add("char");
				expected.add("space");
				expected.add("-");
				expected.add("*");
				expected.add("number");
				expected.add("parantez-kapa");
				expected.add("finish");
				continue;
			} else if (is_numeric(data.charAt(index)) && expected.contains("number")) {
				String sayi = "";
				do {
					sayi = sayi + data.charAt(index);
					index++;					
				} while(index < data.length() && is_numeric(data.charAt(index)));
				
				System.out.println("intConstant ('" + sayi + "')"); 
				
				expected.clear();
				expected.add("space");
				expected.add("-");
				expected.add("*");
				expected.add("parantez-kapa");
				expected.add("finish");
				continue;
			} else if ((data.charAt(index) == '-') && expected.contains("-number")) {
				String sayi = "-";
				boolean once = false;
				index++;
				while(index < data.length() && is_numeric(data.charAt(index))) {
					once = true;
					sayi = sayi + data.charAt(index);
					index++;
				}
				
				if (!once) { System.out.println("Erör: - beklenmiyordu."); return false; }
				System.out.println("intConstant ('" + sayi + "')");
				
				expected.clear();
				expected.add("space");
				expected.add("-");
				expected.add("*");
				expected.add("parantez-kapa");
				expected.add("finish");
				continue;	
			} else if (is_character(data.charAt(index)) && expected.contains("char")) {
				String karakter = "";
				do {
					karakter = karakter + data.charAt(index);
					index++;					
				} while(index < data.length() && is_character(data.charAt(index)));
				
				System.out.println("variable ('" + karakter + "')");
				
				expected.clear();
				expected.add("space");
				expected.add("-");
				expected.add("*");
				expected.add("parantez-kapa");
				expected.add("finish");
				continue;				
			} else if ((data.charAt(index) == '-') && expected.contains("-")) {
				System.out.println("symbol ('-')"); 
				index++;

				expected.clear();
				expected.add("space");
				expected.add("number");
				expected.add("char");
				expected.add("parantez-ac");
				continue;
				/* - değişken kabul oluyor şu notkada. */
			} else if ((data.charAt(index) == '+' || data.charAt(index) == '*') && expected.contains("*")) {
				System.out.println("symbol ('" + data.charAt(index) + "')"); 
				
				index++;
				expected.clear();
				expected.add("space");
				expected.add("number");
				expected.add("char");
				expected.add("parantez-ac");
				continue;
			} else if (data.charAt(index) == ' ' && expected.contains("space")) {
				index++;
				continue;
			} else {
				System.out.println("Erör: Sağ tarafta beklenmeyen karakter. Beklenenler: " + expected.toString()); 
				return false;
			}
		}
	}

	/**
	 * Gönderilen karakterin rakam olup olmadığını bulur.
	 * @param in
	 * @return boolean
	 */
	public static boolean is_numeric(char in) {
		if (!(in =='1'||in=='2'||in=='3'||in=='4'||in=='5'||in=='6'||in=='7'||in=='8'||in=='9'||in=='0')) return false;
		return true;
	}
	
	/**
	 * Gönderilen karakterin geçerli bir değişken ismi oluşturacak karakter olup olmadığını döndürür. 
	 * @example (misal _ A B geçerli ama ? ! 2 geçerli değil.)
	 * @param in
	 * @return boolean
	 */
	public static boolean is_character(char in) {
		if (!(in =='A'||in=='B'||in=='C'||in=='D'||in=='E'||in=='F'||in=='G'||in=='Ğ'||in=='H'||in=='I'||in=='İ'||in=='J'||in=='K'||in=='L'||in=='M'
			||in=='N'||in=='O'||in=='Ö'||in=='P'||in=='R'||in=='S'||in=='Ş'||in=='T'||in=='U'||in=='Ü'||in=='V'||in=='Y'||in=='Z'||
			
			in =='a'||in=='b'||in=='c'||in=='d'||in=='e'||in=='f'||in=='g'||in=='ğ'||in=='h'||in=='ı'||in=='i'||in=='j'||in=='k'||in=='l'||in=='m'
			||in=='n'||in=='o'||in=='ö'||in=='p'||in=='r'||in=='s'||in=='ş'||in=='t'||in=='u'||in=='ü'||in=='v'||in=='y'||in=='z'||in=='_'		
		)) return false;
		return true;
	}
}
👋 🚨 Yeni yazılardan haberdar olmak ister misiniz? 👇

PL: Lexical Analyzer 2 yorum aldı.

  1. En alttaki kod

    if( (in>64 && in96 && in<123) || in=='ğ' ||in=='Ğ'||in=='İ'||in=='Ö' ||in=='Ş' ||in=='ş' ||in=='ö' ||in=='ü'||in=='_' ||in=='Ü')

    olsa yeterli olur diye düşündüm ama java da bu olmadı neden?…

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir